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Einleitung 


Der Sonderforschungsbereich 5 hat in seinem Symposium "In- 
tertemporale Allokationen" Anfang 1984 im Kontext ver- 
schiedener Problembereiche die Relevanz optimaler Kontrol- 
lansätze zur Beurteilung der intertemporalen Interdepen- 
denzen wirtschaftlicher Entscheidungen zur Diskussion ge- 
stellt. Die Hamilton-Funktion als "performance"-Indikator 
erwies sich dabei als ein ebenso unersetzliches Requisit 
wie der Begriff der Nutzungskosten als Opportunitätskosten 
der Zukunft. Interdependente Zusammenhänge lassen sich 
formal nur mit einem adäquaten Instrumentarium behandeln. 
Ein Rückgriff auf die komparative Statik der Lehrbuch- 
ökonomie mag zwar häufig als leichter "einsichtig" er- 
scheinen, schließt aber auch Fehlurteile nicht aus. Das 
gleiche gilt für die Beurteilung der intertemporalen Wir- 
kungsweise wirtschaftspolitischer Maßnahmen, wenn nur der 
deterministische Teil eines Modells Verwendung findet und 
die stochastischen Komponenten vernachlässigt werden. 


Die Notwendigkeit, insbesondere bei Politiksimulationen 
mit makroökonomischen Modellen explizit stochastische Ele- 
mente zu berücksichtigen, läßt sich aus den verschiedenen 
Fehlerursachen von Entscheidungsmodellen begründen: 


l. Aus den Unsicherheitseffekten des ökonometrischen 
Modells per se, so Fehler in den Gleichungen - also 
der Einfluß nichtmodellierter Variablen auf das 
Modellverhalten -, Meß oder Beobachtungsfehler in den 
Variablen oder zeitvarianter stochastischer Parameter. 
Die Vernachlässigung des Einflusses stochastischer 
Elemente kann kurzfristig falsche Zustandsentwicklun- 
gen implizieren, die dann als Grundlage für eine Be- 
stimmung des optimalen Einsatzes wirtschaftspoli- 
tischer Instrumente ungeeignet sind. Die klassische 


Studie von Adelmann und Adelmann über das 
Konjunkturverhalten des Klein-Goldberger-Modells mag 
als Hinweis dienen. 


2. Die Bezugnahme auf eine Zielfunktion verlangt Informa- 
tionen über die Präferenzstruktur der Entscheidungs- 
träger, die in der Regel unvollkommen und ungenau 
nicht nur bezüglich der funktionalen Form, sondern 
auch hinsichtlich der Bewertung der einzelnen Ziele 
und bezüglich der Länge des Planungshorizonts sind. 
Und schließlich sind die Informationen über den (zu- 
künftigen) Verlauf exogener Variablen unsicher, gleich 
ob es sich um echte exogene Größen oder von Entschei- 
dungsträgern gewünschte Zielpfade handelt. 


Der vorliegende Band behandelt einige Problembereiche der 
Kontrolltheorie und ihrer Anwendung in der Ökonomie, die 
bei dem eingangs erwähnten Symposium nicht oder nur am 
Rande angesprochen wurden und die stochastische Aspekte 
von Entscheidungsmodellen zum Gegenstand haben. 


= Die Bedeutung während des Planungszeitraums zusätzlich 
anfallender Informationen für die Aufstellung optima- 
ler Entscheidungsregeln, insbesondere Lerneffekte be- 
züglich der stochastischen Eigenschaften des ökonome- 
trischen Modells, 


= die Evaluierung der deterministischen und sto- 
chastischen Komponenten von Kostenfunktionalen, darge- 
stellt anhand der Philipps-Kurven-Problematik für die 
Bundesrepublik Deutschland, und 


- die Sensitivität optimaler feed-back-Regeln bei Vari- 
ation der Parameter einer Zielfunktion, wiederum an- - 
hand eines einfachen makroökonomischen Modells für die 
Bundesrepublik Deutschland. 


Ausgangspunkt dieser Untersuchungen ist immer ein makro- 
ökonomisches Modell, so daß einige kurze Bemerkungen zur 
Anwendbarkeit dieser Modelle im kontrolltheoretischen Kon- 
text angebracht erscheinen. Trotz mancher grundsätzlicher 
Dispute über die Modellierbarkeit ökonomischer Verhaltens- 
weisen mittels aggregierter Funktionalzusammenhänge bilden 
zwar makroökonometrische Modelle auch heute noch eines der 
wichtigen Hilfsmittel zur Konjunkturdiagnose und -progno- 
se, ihre Anwendbarkeit zur Bestimmung optimaler Politiken 
wird aber insbesondere in Verbindung mit der Theorie ra- 
tionaler Erwartungen der Wirtschaftssubjekte angezweifelt. 
So kommt vor allem Lucas zu der Auffassung, daß im Falle 
rationaler Erwartungen makroökonometrische Modelle und 
darauf basierende kontrolltheoretische Verfahren völlig 
wertlos seien, da die Strukturgleichungen nicht invariant 
gegenüber den Zukunftserwartungen der Wirtschaftssubjekte 
seien. Einwände gegen diese Kritik dürfen sich dabei nicht 
mit dem Hinweis begnügen, die Hypothese rationaler Erwar- 
tungen sei wirklichkeitsfremd. Wie Kykland und Prescott 
gezeigt haben, genügt zur Abstützung des Lucas'schen Argu- 
ments, daß Wirtschaftssubjekte in etwa die Wirkungsweise 
wirtschaftspolitischer Maßnahmen abschätzen können. 


Sims hat die Gegenargumente sehr ausführlich dargelegt, so 
daß hier nur kurz darauf eingegangen werden muß. Sicher- 
lich ist es richtig, daß der Wirkungsgrad spezifischer 
wirtschaftspolitischer Maßnahmen gegen Null konvergiert, 
wenn diese so ausgestaltet sind, daß die Wirtschaftssub- 
jekte sie durch eine entsprechende Veränderung ihrer Ver- 
haltensweise konterkarieren können. Als typisches Beispiel 
mag die rückzahlbare Ergänzungsabgabe zur Einkommensteuer 
dienen, die eine intertemporale Umschichtung in der Er- 
sparnisbildung zur Folge hatte und nicht die geplante Re- 
duktion der privaten Konsumnachfrage bewirkte. Anderer- 
seits ist jedoch ebenso zutreffend, daß zahlreiche wirt- 
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schaftspolitische Maßnahmen in ihren Auswirkungen für die 
betroffenen Wirtschaftssubjekte (und häufig auch für den 
Entscheidungsträger) nicht unmittelbar erkennbar sind; sei 
es, weil sie von unterschiedlichen und zum Teil in ihren 
Zielvorstellungen konträr handelnden Entscheidungsträgern 
getroffen werden, sei es, weil sie wegen überlappender 
Wahlperioden nicht auf ihren langfristigen Effekt, sondern 
zur Durchsetzung kurzfristiger politischer Ziele angesetzt 
waren, oder sei es auch, daß die Öffentlichkeit zwar die 
Wirkungsweise spezifischer aber nicht allgemeiner wirt- 
schaftspolitischer Maßnahmen erkennt. "And since the 
public always understands particular causes better than 
general causes the depression which will be attributed to 
the industrial disputes which will accompany it, .... to 
anything in the world accept the general monetary policy 
which has that the whole thing going." Vielleicht gilt 
diese Aussage von Keynes trotz der Verfeinerung des theo- 
retischen Instrumentariums auch heute noch. 


Wie immer man auch zur Anwendbarkeit makroökonomischer Mo- 
delle für die Politikberatung steht, auch im theoretisch- 
methodischen Bereich sind noch eine Vielzahl von Problemen 
ungeklärt. Das gilt zum einen für die Frage, welche Be- 
deutung im Planungszeitraum neu anfallende Informationen 
in ihren Auswirkungen auf die optimalen Entscheidungs- 
regeln besitzen. In der gängigen Version von Entschei- 
dungsmodellen - deterministischer oder stochastischer Art 
- wird im allgemeinen unterstellt, daß für die Ableitung 
der Entscheidungsregeln nur die zu Planungsbeginn vorhan- 
dene Information verwendet wird. Daß diese Annahme wirk- 
lichkeitsfremd ist, muß nicht besonders betont werden. 
Frommholz untersucht in seinem Beitrag die Bedeutung von 
Lernprozessen bezüglich der stochastischen Größen eines 
Modells. Dabei handelt es sich nicht nur um passive Lern- 
prozesse, also eine Neuschätzung der Strukturgleichungen 
eines Modells auf Grund zusätzlicher Informationen, 
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sondern auch um aktive Lerneffekte über die Stochastik des 
Modells. Der Beitrag behandelt unter anderem Probleme der 
adaptiven Kovarianzkontrolle, wobei gezeigt werden kann, 
daß adaptive Entscheidungsregeln andere Verläufe der In- 
strumentvariablen implizieren, wie sie beispielsweise von 
Chow dargestellt wurden. Der Beitrag untersucht weiterhin 
approximative Kontrollalgorithmen und Verfahren einer 
adaptiven "closed loop"-Kontrolle, die eine Zerlegung des 
Kontrollproblems in drei Komponente zuläßt. 


Franz, Kempf und Kräger behandeln in ihrem Beitrag insbe- 
sondere die Frage, welche Bedeutung der stochastischen 
Komponente bei der Evaluation der Entscheidungsregeln zu- 
kommt. Ausgangspunkt ist ein öÖökonometrisches Modell des 
Arbeitsmarktes der Bundesrepublik Deutschland, das um eine 
Strukturgleichung für die Preisbestimmung ergänzt wird. 
Als Kostenfunktional dienen die quadrierten Abweichungen 
der Inflationsrate und Arbeitslosenquote von im Zeitablauf 
vorgegebenen Zielwerten, so daß der trade-off entsprechend 
der Philipps-Kurve berechnet werden kann. Als wesentliche 
Erkenntnis dieses "Beispiels" ist festzuhalten, daß der 
stochastische Anteil an den Gesamtkosten sehr hoch ist und 
ohne eine Berücksichtigung der Restgrößen die Beurteilung 
dieses trade-offs zu Trugschlüssen führen kann. 


Im letzten Beitrag untersuchen Frommholz und Wolters die 
Sensitivität optimaler Politiken bei einer Veränderung der 
Parameter der Zielfunktion. Grundlage dafür ist ein von 
Frowen und Arestis für die Bundesrepublik Deutschland ge- 
schätztes Modell. Als wichtigstes Ergebnis zeigt sich, daß 
eine Variation des Planungshorizonts für die optimalen 
Pfade von untergeordneter Bedeutung ist, die Auswahl der 
Zielpfade jedoch einen außergewöhnlich großen Einfluß be- 
sitzt. 
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Die in diesem Band veröffentlichten Studien wurden im 
Rahmen des von der Deutschen Forschungsgemeinschaft 
unterstützen Projektes "Stochastische Stabilisierungs- 
politik" angefertigt, dessen Arbeit eng mit Projekten des 
Sonderforschungsbereichs 5 verbunden ist. Der Deutschen 
Forschungsgemeinschaft sei für die großzügige Förderung 
gedankt. Den Autoren dieses Bandes gebührt mein besonderer 
Dank für die zahlreichen Stunden fruchtbarer Diskussion. 
Insbesondere schulden wir aber alle unseren Dank Frau 
Böhm, Frau Burst und Frau Räuchle, die das Manuskript in 


einer vorzüglichen Weise fertiggestellt haben. 


Heinz König 
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Adaptive Entscheidungsmodelle 


Harald Frommholz 


l. Uberblick über adaptive Entscheidungsmodelle 


1.1 Allqemeine Bemerkunqen 


In den einfachen Entscheidungsmodellen (deterministischen 
sowie stochastischen) geht man stets von der Voraussetzung 
aus, daß bei der Ableitung der optimalen Entscheidungs- 
regel nur Informationen verwendet werden, die schon am An- 
fang des Planungszeitraumes verfügbar sind; zusätzliche 
Informationen, die während des Optimierungszeitraumes an- 


fallen, werden dabei nicht berücksichtigt. 


Die adaptiven Entscheidungsregeln werden dagegen durch die 
Einbeziehung aktueller (im Planungszeitraum anfallender) 
Informationen bei der Auswahl der optimalen Kontrollregeln 
charakterisiert; sie können deshalb auch als Weiterent- 
wicklung bzw. Verallgemeinerung der stochastischen Opti- 
mierungsmodelle aufgefaßt werden. Im Zeitablauf findet 
hier für den Entscheidungsträger ein Lernprozeß bezüglich 
der stochastischen Größen des Modells statt. Die Berück- 
sichtigung tatsächlicher Realisationen der Zufallsgrößen 


bzw. die Adaption zukünftiger Beobachtungen stellt gegen- 


14 


über dem einfachen stochastischen Entscheidungsmodell, das 
nur additive Störterme erfaßt, einen Informationsgewinn 
dar, der zu einer Verbesserung der optimalen Politik ge- 
nutzt werden kann. Durch die Steuerung der Politik- 
variablen kann hierbei eine Beeinflussung des Informa- 


tionsgewinns stattfinden. 


Die Notwendigkeit adaptiver Kontrolle wird häufig damit 
begründet [siehe Rausser und Hochman (1979)], daß die Ein- 
führung eines neuen Systems i.a. unbekannte Parameter 
impliziert, so z.B. bei der Nachfragefunktion eines auf 
dem Markt neu eingeführten Produktes oder bei einer Pro- 
duktionsfunktion bezüglich einer neuen Technologie. Іп 
vielen Fällen kann auch angenommen werden, daß die Para- 
meter eines schon etablierten Systems im Zeitablauf vari- 
ieren. Die Einbeziehung des zeitlichen Verlaufs der Para- 
meter sollte aber bei der Ableitung der optimalen Kontrol- 
le mit einbezogen werden, um eine bessere Politik zu 
ermöglichen. Weiterhin kann der Politikeinsatz das zugrun- 
deliegende Gkonometrische Modell so beeinflussen, daß die 
geschätzten Parameter, d.h. die Systemdarstellung, für den 
Optimierungszeitraum nicht mehr adäquat sind und deshalb 


adaptive Kontrollmethoden erfordern. 


Im deterministischen Entscheidungsmodell impliziert die 
Einbeziehung zusätzlicher Informationen bei der Bestimmung 
der optimalen Politik keine verbesserte Entscheidungsre- 
gel, da die zukünftigen Realisationen der Systemzustände 
mit Sicherheit schon zu Beginn des Planungszeitraumes be- 
kannt sind, wenn gleichzeitig eine konstante Modell- 
struktur unterstellt wird, d. h. für das deterministische 
Entscheidungsmodell ist kein Informationsgewinn während 
des Optimierungszeitraumes möglich; dies impliziert, daß 
alle Entscheidungssysteme für das deterministische Problem 


identisch sind. 
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Die verschiedenen stochastischen Entscheidungsregeln un- 
terscheiden sich hinsichtlich der zur Bestimmung der opti- 
malen Politiken verwendeten Informationsmenge bzw. Infor- 
mationsniveaus, d.h. bezüglich der Verfügbarkeit und Ein- 
beziehung vergangener und möglicher zukünftiger Beobach- 
tungen. 

Ist die Lernmöglichkeit im Planungszeitraum, verglichen 
mit dem Informationszustand zu Beginn der Optimierung, zu 
gering - dies kann der Fall sein, wenn der Optimierungs- 
zeitraum im Vergleich zum zugrundeliegenden Beobachtungs- 
zeitraum (Schätzzeitraum) sehr kurz ist -, so ist die Ent- 
scheidungsregel des einfachen stochastischen Modells an- 
nähernd optimal für das adaptive Modell. 


1.2 Passive adaptive Entscheidungsmodelle 


In der Literatur [vgl. Rausser und Hochman (1979) und 
Kendrick (1981)] wird nach passiven und aktiven adaptiven 
Kontrollregeln unterschieden. Chow (1975) spricht in die- 
sem Zusammenhang auch von Entscheidungsmodellen mit passi- 


ven bzw. aktiven Lerneffekten. 


Im allgemeinen liegt passives Lernen vor, wenn die unbe- 
kannten Parameter des Systems nach jeder Realisation im 
Zeitablauf neu geschätzt werden. Dieser "passive" Lern- 
effekt ist unabhängig von der Bestimmung der optimalen 
Politik, das angewandte Optimierungsverfahren bleibt er- 
halten. Die Berücksichtigung dieser Lernmöglichkeit impli- 
ziert für die praktische Vorgehensweise, daß nach der Be- 
rechnung der optimalen Entscheidung der ersten Periode die 
Parameterschätzungen des Modells aufgrund des neu reali- 
sierten Systemzustandes der ersten Periode revidiert wer- 
den. Mit Hilfe zusätzlicher Beobachtungen können so die 
Wahrscheinlichkeitsverteilungen der Parameter aktualisiert 


werden, man spricht auch vom "updaten"; verschiedene 
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Methoden können hierzu herangezogen werden, so z.B. Baye- 
sianische Methoden (Zellner, 1971), Revısionsmethoden der 
Kleinsten Quadrate (Albert und Sittler, 1965) und Kalman 
Filter (Kalman, 1960). 

Anschließend wird dann erst mit der aktualisierten Vertei- 
lung der Parameter die optimale Entscheidung der zweiten 


Periode bestimmt. 


Die Berechnung der passiven adaptiven Entscheidungsregeln 
besteht demzufolge aus zwei unterschiedlichen Prozeduren: 
einem Optimierungsansatz, der zu jedem Zeitpunkt die opti- 
male Politik auswählt, und einer Prozedur, die zu jedem 


Zeitpunkt die Parameterschätzungen revidiert.!) 


Unterschiedliche Optimierungsansätze implizieren alterna- 
tive stochastische Kontrollmethoden. Wenn die Unsicherheit 
bezüglich der Parameter vernachlässigt wird, spricht man 
von "sequential certainty equivalence", "update certainty 
equivalence” (Rausser, 1977) oder von "heuristic certainty 
equivalence" (Norman, 1976). Werden dagegen die Parameter- 
unsicherheiten bei der Ableitung der optimalen Kontrolle 
zu jedem Zeitpunkt berücksichtigt, so erhalten wir die so- 
genannte "open-loop feedback"-Methode [vergleiche auch 
Kendrick (1981)]. 


Eine noch speziellere Klassifikation stochastischer Ent- 
scheidungsmodelle nimmt Rausser (1977) vor; bei Modellen 
mit Parameterunsicherheit unterscheidet er zwischen "open- 
loop feedback"-Regeln und "sequential stochastic control". 


Als "sequential stochastic control" bezeichnet er 


1)Methodisch werden die passiven adaptiven Entschei- 
dungsregeln durch die Annahme charakterisiert, daß die 
stochastischen Parameter in jedem Optimierungsschritt un- 
abhängig verteilt sind. Durch einen bestimmten Instru- 
menteneinsatz kann keine gezielte Veränderung bzw. Steu- 
erung der Verteilungsinformation vorgenommen werden. 
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Kontrollmethoden, die zwar bei der Optimierung zukünftige 
Beobachtungen einbeziehen, diese aber nicht zur Anpassung 
der Wahrscheinlichkeitsverteilung der Parameter verwenden. 
(Vergleiche hierzu Chow (1975), Rausser und Freebairn 
(1974), Zellner (1971) und Prescott (1971)). "Open-loop 
feedback"-Regeln werden bei Aoki (1967), Bar-Shalom und 
Silvan (1969), Curry (1969), Ku und Athans (1973) und Tse 
und Athans (1972) behandelt. 


Zu den bisher vorgestellten Entscheidungsmodellen wird 
nach der Implementierung der jeweils ersten Entscheidung 
mit einem um eine Periode verkürzten Planungszeitraum die 
nachfolgende optimale Politik bestimmt.. Eine alternative 
Vorgehensweise stellt die Annahme eines konstanten Opti- 
mierungszeitraumes dar. Der Planungszeitraum wird nach 
jedem Optimierungsschritt um eine Periode verschoben, so 
daß stets ein Entscheidungsproblem mit einem gleichlangen 
Planungszeitraum gelöst werden muß. Es ist hierbei aber zu 
beachten,daß jeweils eine neue Zielfunktion zu spezi- 
fizieren ist. In der Literatur wird dieses Problem als 


"rolling-horizon"-Verfahren bezeichnet (s. Theil, 1964). 


Eine weitere Klasse von Entscheidungsregeln wird durch die 
"m-measurement"-Politiken dargestellt [Rausser und Hochman 
(1979) sowie Pekelman und Rausser (1978)]. Hierbei wird 
unterstellt, daß der Entscheidungsträger neben den gegen- 
wärtigen Beobachtungen und Informationen auch die m fol- 
genden Beobachtungen zur Ableitung der optimalen Entschei- 
dung verarbeitet. Färber (1981) unterscheidet in diesem 
Zusammenhang die einfache "m-measurement"-Politik, wobei 
die optimalen Politiken für den gesamten Planungszeitraum 
bestimmt und implementiert werden, sowie die "m-mea- 
surement feedback"-Politik, die jeweils zusätzliche anti- 
zipierte Informationen für weitere m-Perioden im Opti- 
mierungsalgorithmus berücksichtigt. Nach jedem Optimie- 


rungsschritt, d.h. nach Implementierung der jeweils ersten 
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Entscheidung, verfügt der Entscheidungsträger im letzteren 
Fall weiterhin über m zusätzliche Beobachtungen. 

Die Durchführung passiver adaptiver Kontrollverfahren ist 
in der Praxis ohne große Probleme möglich, da das Optimie- 
rungsverfahren nicht direkt durch die zusätzliche Verfüg- 


barkeit aktueller Informationen beeinflußt wird. 


1.3 Aktive adaptive Entscheidungsmodelle 


Im allgemeinen sollte jedoch die Aktualisierung der 
Systemdarstellung nicht unabhängig von der Ableitung der 
optimalen Politik gesehen werden. Die Klasse der aktiven 
adaptiven Kontrollmethoden wird durch eine "aktive" 
Informationsakkumulation charakterisiert; der Prozeß der 
Informationsanhäufung bzw. Informationsgewinnung ist hier- 
bei im Gegensatz zu den passiven Entscheidungsmodellen im 
Optimierungsprozeß integriert, d.h. er findet nicht unab- 
hängig vom Optimierungsverfahren statt. Der Entscheidungs- 
träger versucht, den Informationsgewinn, den er durch die 
Einbeziehung zukünftiger Beobachtungen erwartet, schon zu 
Beginn des Entscheidungsprozesses zu berücksichtigen und 
durch eine Veränderung der Kontrollvariablen in zukünf- 
tigen Perioden aktiv zu manipulieren und zu vergrößern. 
Diese Lerneffekte ermöglichen eine gleichzeitige verbes- 
serte Systemdarstellung und Kontrolle. Für die Kontroll- 
verfahren bedeutet dieses Vorgehen die Aufgabe der Annah- 
me, daß die stochastischen Parameter zeitlich unabhängig 


verteilt sind. 


Der Vorteil der aktiven adaptiven Entscheidungsmodelle 
gegenüber den passiven adaptiven Entscheidungsmodellen ist 
natürlich davon abhängig, inwieweit eine verbesserte Sy- 
stemdarstellung zu "besseren" optimalen Politiken in der 
Zukunft führt. Das Experimentieren zu Beginn des Pla- 


nungszeitraumes impliziert zunächst höhere Kosten, da der 
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Entscheidungsträger vom optimalen Kontrollpfad abweicht; 
in späteren Perioden können jedoch die Kosten eventuell 
durch eine verbesserte Politik, die dann auf einer genau- 
eren Systemkenntnis basiert (System- und Parameterschät- 
zungen) vermindert werden. Diese experimentelle Komponente 
ist natürlich nur dann von Bedeutung, wenn der Gewinn in 
den zukünftigen Perioden die anfänglichen Verluste aus- 
gleicht und überwiegt. So z.B. fordert Dreze (1972), daß 
der Monopolist von dem Preis, der seinen erwarteten Gewinn 
maximiert, abgeht, um mehr Informationen über die Nach- 


fragefunktion zu erhalten. 


Kendrick (1981) verdeutlicht den Unterschied zwischen 
passivem und aktivem Lernen anhand eines von Astrom kon- 
struierten Beispiels, das stochastische Kontrollverfahren 
für große Öltanker entwickelt. Immer wenn ein Tanker Rohöl 
übernimmt oder entlädt, reagiert das Schiff unterschied- 
lich auf Steueränderungen. Verläßt der Tanker den Hafen, 
besteht der passive Lerneffekt in der nach wenigen Minuten 
jeweils wiederholten Neuschätzung der Reaktionsparameter. 
Beim aktiven Lernen wird die optimale Kontrolle anfangs 
gestört, um ein schnelleres Lernen der Schiffsreaktionen 
auf alternative Steuermaßnahmen zu ermöglichen. Im gewis- 


sen Sinne wird so der Lernprozeß beschleunigt. 


Die passiven adaptiven Entscheidungsregeln, dargestellt 
durch die "feedback"-Regeln, beinhalten keine experimen- 
telle Komponente, sie lassen nur "accidental learning" zu 
[s. Tse (1974)], d.h. die Größe des Lerneffekts wird nicht 
direkt von einer vorhergehenden Entscheidungsvariablen 
gesteuert. Der Lerneffekt besteht allein darin, daß die 
Koeffizienten. des Modells nach jeder Periode (Realisation) 
neu geschätzt werden; der Lernvorgang ist hierbei voll- 


ständig passiv. 
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Die aktiven Entscheidungsregeln berücksichtigen dagegen 
zukünftiges Lernen; es besteht die Möglichkeit, zukünftige 
Unsicherheiten zu antizipieren. Der Unterschied zwischen 
den "feedback" und aktiven adaptiven Entscheidungsregeln 
liegt demnach in der Informationsmenge, die dem Entschei- 
dungsträger zur Bestimmung der optimalen Entscheidung zur 
Verfügung steht bzw. die er zur Auswahl der optimalen Po- 


litik verwendet. 


Die aktiven adaptiven Kontrollmethoden werden auch häufig 
unter dem Begriff der "dualen" bzw. "dual adaptiven" Kon- 
trolle zusammengefaßt. Schon Feldbaum (1965) zeigte, daß 
die Wahl einer optimalen Politik im dualen Modell proble- 
matisch ist, da sie gleichzeitig zwei im gewissen Sinne 
konkurrierende Zielrichtungen verfolgt. Der sogenannte 
duale Effekt besteht darin, daß einerseits ein aktiver 
Lernprozeß bezüglich der unbekannten Komponenten des 
Modells (Parameter sowie Systemzustände) ermöglicht werden 
soll und andererseits die vorgewählten und gewünschten 
Zielwerte erreicht werden sollen, d.h. in diesem Konflikt 
zwischen Schätzung und Kontrolle muß die Entscheidung so 
gewählt werden, daß gleichzeitig die Unsicherheiten im 
Modell verringert werden und das System in eine gewünschte 
Richtung gelenkt wird. Die simultane Lösung dieses 
Kontroll- und Lernproblems impliziert jedoch nicht, daß in 
die Zielfunktion eine zusätzliche Komponente, die den 
Lerneffekt berücksichtigt, integriert wird. Die Zielfunk- 
tion enthält nur die erwarteten Kosten der Abweichungen 
der Systemzustände (erweitert um die Instrumentvariablen) 
von den gewünschten Zielpfaden. Die Minimierung der er- 
warteten Kosten schließt jedoch einen "trade-off" zwischen 
Systemdarstellung und Lernen nicht aus [s. Kendrick 
(1981)]. 


Der duale Kontrollansatz wird hauptsächlich durch drei 


Komponenten charakterisiert: direkte Kontrolle, Lernen und 


21 


Experimentieren. Der duale Effekt kann nur in der soge- 
nannten "closed-loop"-Regel vollständig berücksichtigt 
werden. Die "closed-loop"-Politik ist so konzipiert, daß 
sie alle zusätzlichen Informationen aus dem Beobachtungs- 
und Planungszeitraum zur optimalen Entscheidungsfindung 
verarbeitet. Hierbei findet jedoch im Gegensatz zu den 
passiven Modellen kein sequentielles Implementieren der 
optimalen Kontrollen der jeweils ersten Periode statt; die 
abgeleiteten optimalen Politiken werden beim "closed- 
loop"-Verfahren gänzlich implementiert. Die "closed-loop"- 
Methode ist für die stochastischen Entscheidungsmodelle 
wohl das geeignetste Kontrollverfahren, da die aktive 
Lernkomponente bei der Ableitung der optimalen Politiken 
vollständig erfaßt wird. Dieses Verfahren erlaubt es, daß 
die gegenwärtige Politik nicht nur die zukünftigen System- 
zustände, sondern auch die Unsicherheit der zukünftigen 
Zustände beeinflussen kann, d.h. die Kontrolle kann so 
eingesetzt werden, daß "bessere" Schätzungen für die 


Systemzustände erreicht werden können. 


Ein Problem stellt in diesem Zusammenhang die Informa- 
tionsform bzw. der Informationsgehalt dar, der durch die 
Einbeziehung zukünftiger und damit noch unbekannter Beob- 
achtungen impliziert wird. Die einzigen Informationen, die 
dem Entscheidungsträger über die zukünftigen Beobachtungen 
zur Verfügung stehen, sind die Wahrscheinlichkeitsvertei- 
lungen der entsprechenden Zufallsvariablen des Modells. 
Bar-Shalom und Tse (1974) sprechen hierbei vom "future 
observation program and its associated statistics". Dage- 
gen berücksichtigen die "feedback"-Regeln nur die "past 
observation information". Die aktiven adaptiven Kontroll- 
regeln können so als Funktion der Momente der Wahrschein- 
lichkeitsverteilungen der Zufallsvariablen aufgefaßt wer- 
den. Wegen der Einbeziehung eines aktiven Lernprozesses 
(der Vergrößerung der Informationsmenge durch Experimen- 


tieren) hängen die Kovarianzen der Parameter und Zustände 
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zukünftiger Perioden aber auch von der Wahl der gegen- 
wärtigen Politik ab. 

Bis jetzt ist es noch nicht gelungen, eine analytische Lö- 
sung des "closed-loop" bzw. des dualen Problems anzugeben. 
Feldbaum (1965) sowie Aoki (1967) stellen zwar die rekur- 
siven Gleichungen vor, diese liefern aber keine expliziten 
Lösungen. In der Literatur werden deswegen vorwiegend ana- 
lytische Approximationen und numerisch anwendbare adaptive 
Entscheidungsregeln verwendet. Schon die allgemeine Formu- 
lierung des dualen Kontrollproblems impliziert Nichtli- 
nearitäten, da gewöhnlich die Koeffizienten der Zustands- 
und Kontrollvarıablen die unbekannten Parameter des Mo- 
dells darstellen. Dieses nichtlineare stochastische Ent- 
scheidungsproblem ist nur mittels approximativer Verfahren 
lösbar. Die Leistungsfähigkeit alternativer Approxiima- 
tionsverfahren kann dabei nur anhand von Simulationsläufen 
untersucht werden; Aussagen sind immer nur bezüglich des 
zugrundeliegenden Problems möglich [s. hierzu Norman 
(1976), Bar-Shalom und Tse (1976)]. Eine Rangordnung 


diverser adaptiver Kontrollalgorithmen existiert nicht. 


Die analytischen Probleme verringern sich, wenn die Infor- 
mationsmenge, die dem Entscheidungsträger zur Verfügung 
steht, reduziert wird, d.h. wenn die optimalen Entschei- 
dungen auf einem niedrigen Informationsniveau getroffen 
werden. In der Literatur werden häufig nur die "einfachen" 
stochastischen Entscheidungsregeln berechnet, sie können 
aber nur als erste Approximation einer "closed-loop"-Ent- 


scheidungsregel angesehen werden. 


Zusätzlich werden oft zwei alternative Vorgehensweisen be- 
züglich des Approximationsverfahrens unterschieden, so 
spricht man im allgemeinen von passiven Entscheidungsre- 
geln, wenn die Approximationen bezüglich des Modells vor- 
genommen werden. Aktive adaptive Kontrollverfahren liegen 


dann vor, wenn sich die Approximationen auf die Ableitung 
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der optimalen Kontrollregel, d.h. auf das Optimierungsver- 
fahren, beziehen. Pekelman und Tse (1976), Pekelman und 
Rausser (1978) sowie Rausser und Hochman (1979) demon- 
strieren anhand eines einfachen eindimensionalen Zweipe- 
riodenproblems die analytischen Schwierigkeiten, die bei 
der Ableitung der optimalen "closed-loop"-Regel auftreten 
und so eine Approximation notwendig machen. Die Zielfunk- 
tion des zugrundeliegenden statischen Entscheidungssystems 
kann dabei in eine statische Komponente, die den Effekt 
der Kontrolle. darstellt, und in eine dynamische Kompo- 
nente, die durch Berücksichtigung des aktiven Lerneffekts 
entsteht, zerlegt werden. In dynamischen Systemen ist es 
weitaus schwieriger, die einzelnen Effekte zu separieren, 
da die gegenwärtige Entscheidung die zukünftigen Zustände 
beeinflußt. 


Die Lösung des dualen Kontrollproblems mit Hilfe der dyna- 
mischen Programmierung ist in der Praxis problematisch [s. 
Tse (1974), Tse, Bar-Shalom und Meier (1973)]; das Konzept 
des Informationszustandes führt zu einer unendlichen bzw. 
zu einer (endlichen) über die Zeit wachsenden Informa- 
tionsmenge. Die Weiterentwicklung der Informationsmenge, 
die im Optimierungsprozeß durch die sogenannten "optimal 
cost-to-go"!) dargestellt wird, beinhaltet, wie zukünftige 
Beobachtungen gemacht werden und wie sie durch den Ent- 
scheidungsträger in einer optimalen Weise verwendet wer- 
den. Problematisch ist hierbei, daß die "optimal cost-to- 
go 
tionszustandes bzw. der Informationsmenge sind. Zusätzlich 


im allgemeinen keine explizite Funktion des Informa- 


können Dimensionsprobleme bei der Speicherung der Kon- 
trollwerte bzw. der einzelnen Informationszustände auftre- 
ten, die eine Lösung des Problems praktisch unmöglich ma- 


chen. 


1) Vgl. Abschnitt über "TBM" Ansatz. 
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Um diese Schwierigkeiten bewältigen zu können, werden im 
folgenden Approximationen des dualen Entscheidungsmodells 
vorgestellt; die so erhaltenen Entscheidungsregeln basie- 
ren zwar auf der optimalen "closed-loop"-Regel, stellen 
aber jeweils aufgrund der Approximationen Vereinfachungen 
dieser Entscheidungsregel dar. Es handelt sich hierbei 
also um suboptimale Kontrollregeln der Klasse der aktiven 
adaptiven Entscheidungsregeln. 

Als Unterscheidungsmerkmal alternativer approximativer 
Kontrollverfahren dient die Abhängigkeit zukünftiger In- 
formationen vom gegenwärtigen Politikeinsatz. 

Ausführlich werden im folgenden drei alternative Approxi- 
mationsalgorithmen diskutiert; sie gehen auf Mac Rae 
(1975), Chow (1975) und Tse, Bar-Shalom und Meier (1973) 


zurück, 


2% Adaptive Kovarianzkontrolle 


2.1 Der allgemeine Kontrollalgorithmus 


Der folgende Ansatz von Mac Rae (1975) ist einer der 
einfachsten adaptiven Algorithmen, der aktives Lernen im 
Planungszeitraum bei der Bestimmung der optimalen Ent- 
scheidungsregel berücksichtigt. (Für das eindimensionale 
Entscheidungsproblem siehe Mac Rae (1972), für das multi- 
dimensionale Problem vergleiche Mac Rae (1975)). Der An- 
satz liefert durch vereinfachende Verteilungsannahmen eine 
approximative Lösung der optimalen dualen Kontrollregel; 
zusätzlich wird eine analytische Lösung des Entschei- 


dungsproblems ermöglicht. 


Das Zustandsmodell wird durch die folgende lineare 


reduzierte Form dargestellt: 
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(1) у, = Ау, + Bu, + Cz, + є, = Dw, + є, 
mit D=[A,B,C] und ш, = Гу рц, 2,1 


Der Ansatz von Mac Rae unterstellt, daß keine Meßfehler 
bezüglich der Zustandsvariablen y, vorliegen.!) Die Stör- 
vektoren ze sind hier zeitlich unabhängig und normalver- 
teilt mit Erwartungswert Null und bekannter (stationärer) 
Varianz-Kovarianz Matrix Q (d.h. Ele, e,']| = Q für t = s und 
0 sonst). Ferner wird angenommen, daß die Parameter zeit- 
lich invarıant sind (d.h. die unbekannten, wahren Para- 
meter werden als konstant angesehen), sie sind normalver- 
teilt und mit e, unkorreliert. Die Unsicherheit in den Mo- 
dellparametern wird dadurch berücksichtigt, daß sie als 
Bayesianische Zufallsvariablen modelliert werden, deren 
Mittelwerte und Varianzen mit zusätzlichen Beobachtungen 
im Zeitablauf variieren. Die Verteilung der Zufalls- 
variablen basiert auf a priori Informationen, wobei unter- 
stellt wird, daß der a priori Mittelwert von D gleich D, 
und die a priori Varianz-Kovarianz Matrix von D gleich Г, 
mit den Elementen zeilenweise geordnet, gegeben sind. Da 
die a priori Verteilung eine multivariate Normalverteilung 
ist, läßt sich die a priori oder bedingte Verteilung von D 
bei gegebenen Beobachtungen bis zur Periode t, die dann 
ebenfalls eine multivariate Normalverteilung darstellt, 


durch die a posteriori Varianz Г, und Mittelwert р, пасһ 


t 
folgenden Rekursionsgleichungen berechnen [vgl. Мас Rae 


(1975) Anhang]. 


ra! ww, und 


(2) ES ebe 


(3) vec D; = rl T, 'vecD,/ , +(Q' ә ш,)у,1 für ¢=1,...,T. 


Lige u,und Ze wie bei Chow (1975). 
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wobei der Operator vec Matrizen in Vektoren überführt und 
@das Kroneckerprodukt darstellt. Die Gleichungen (2) und 
(3) beschreiben hier vollständig die zur Verfügung stehen- 
de Informationsmenge. Bei Annahme einer quadratischen 
Zielfunktion ist die Lösung dieses Entscheidungsproblems 
im allgemeinen analytisch nicht möglich, da die Mittel- 
werte und Varianzen in (2) und (3) von den unbekannten zu- 
künftigen Werten für w, und у abhängen und somit natürlich 
stochastisch sind . 


Mac Rae schlägt nun eine strukturelle Approximation zur 
Lösung des obigen Entscheidungsproblems vor, d. h. die 
obigen Gleichungen (2) und (3) werden durch ähnlich 
strukturierte Gleichungen ersetzt. Prescott (1972) löst 
das Problem für den eindimensionalen Fall mit Hilfe einer 


numerischen Approximation. 


Bei der strukturellen Approximation werden die unbekannten 
zukünftigen Beobachtungen in den "update"-Gleichungen 


durch erwartete Beobachtungen ersetzt, es gilt dann: 
(4) Г,! = rl, +Q2'@E [w,w,] und 
(5) vec D’ = Т, Tpl veer ЕГО! э ш) у, h. 


Die Erwartungswertbildung basiert auf den Informationen zu 
Beginn des Planungszeitraumes. Wird in (5) y, durch Desi We 
ersetzt, so folgt vec a = vec Dr? die approximierten 
"updated" Mittelwerte sind für alle t im Planungszeitraum 
konstant und gleich dem a priori Mittelwert. 

Das Vorgehen von Mac Rae wird also dadurch charak- 
terisiert, daß die bedingten Verteilungen von D durch 
unbedingte Verteilungen separater unabhängiger Zufalls- 
variablen De mit Mittelwert D, und Varianz wie in (4) er- 
setzt werden. Der Lernprozeß wird durch Gleichung (4) er- 
faßt; die Politik u, beeinflußt indirekt über w, die zur 
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Verfügung stehende Informationsmenge. r, gibt also jeweils 
den relevanten Informationsstand des Entscheidungsträgers 


an. 


Die optimale Entscheidungsregel dieses approximativen Kon- 
trollansatzes ist eine Folge von stochastischen "feed- 
back"-Regeln, wobei jeweils nur die Politik für die erste 
Periode implementiert wird. Die Berechnung erfolgt über 
die Minimierung des Erwartungswertes einer quadratischen 
Zielfunktion unter der Nebenbedingung des stochastischen 
Differenzengleichungsmodells und der deterministischen 
"Varianz-Update-Gleichung". Mac Rae benutzt zur Lösung des 
Kontrollproblems eine Kombination der "Dynamischen Pro- 
grammierung" und des Lagrange-Ansatzes [siehe auch Bellman 
(1961)]. 


Im -Gegensatz zu Mac Rae verwenden wir im folgenden 
explizit eine quadratische Verlustfunktion!). Die Instru- 
mentvariablen werden dabei nur indirekt durch den erwei- 
terten Zustandsvektor berücksichtigt. Zusätzlich wird un- 
terstellt, daß keine Abdiskontierung im Zeitablauf statt- 
findet. Die zu minimierende Zielfunktion hat dann im vor- 


liegenden Fall die folgende Form: 


T 


_ Kä , 
(6) W=E ke ESCH 


T 

+N el t-r ee ww, h | 
aw Ц t t t-l t t 

t= 


t=1 


1) Die quadratische Verlustfunktion hat folgende Form: 


W=E 


T 
N -a) = 
= ө, а,) KY, a) Í 
t= 


wobei K, eine positiv semidefinite Matrix und a, die ge- 
wünschten Werte (Sollpfade) darstellen. 
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Die Berücksichtigung der Nebenbedingung impliziert eine 
Matrix M von Lagrangemultiplikatoren; sie ist symmetrisch 
und hat die gleiche Dimension wie T,. Das Optimie- 
rungsverfahren besteht aus zwei Schritten. Zunächst lie- 
fert die dynamische Programmierung Lösungen für иу,...,ит 
und T,,...,T7 bei gegebenen Werten für M),... Mpe Da die Be- 
ziehungen zwischen zeitlich verschiedenen T, hierbei nicht 
erfaßt werden, erfüllen die so erhaltenen Werte für T, im 
allgemeinen auch nicht die "Varianz-Update"-Gleichung. Im 
zweiten Schritt werden Werte für м, so gewählt, daß 
Gleichung (4) erfüllt ist. 


Die dynamische Programmierung zerlegt die Optimierung in T 
Optimierungsschritte, für die letzte Periode lautet die zu 
minimierende Zielfunktion bei Verwendung des von Mac Rae 


eingeführten Sternproduktes: 


1 


SH , _1 
+M, a Гар ш (9 * M lm, 
— is D А 3 i 
= Br le Н pyr = 2), Antec FIN i — М) * е 


i -1 
- Wa (Q Ы Му) шу | 


und c.= a, K. a. 


mit H. = К һ = K ат т т Кт аг, 


T’? T T 


(ürt=1 wid Mu" weggelassen ). 


1 


Setzen wir für Ут Gleichung (1) ein und bilden den 


Erwartungswert, so folgt: 
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ze DH И = 1 "пу 
(8) W„=wrtE,_ [DH D]- Ql * M.) wp -2w,D'h, 


-1 
ter t (M. рМ Га + Но Q 


= ‘om T -1 
= ш (D н.р + H. * La -Q "NM. шт 


— 2w Dh, +c, + ( M. 


-1 
r ra -M„J*T,_,+ ËM? 


Durch Aufspalten der Terme D, My, Dat und wp ergibt sich 


dann: 


ч Mr aye , гАА е АА 
(9) W _ (MH A+ H ra - Q * Mr Yra 


‘Do A BA -1 BA 
Pets [BH A +H; * Г ү-0 “мү ур 


. un Ki « „BC -1 BC 
+2u lB'H CH. DRM 


e Aa Ze С -1 AC 
+2 MA IC + H. * 0 EM ls, 


— 2 Yr_ Ah, – 2 ит Bh, — 2 Zr Ch, 


- 1 
GL ONE MEA +e +H,*Q 


Die Minimierung von Wr bezüglich up liefert dann folgende 
lineare Entscheidungsregeln: 
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(10) t= Сър t+ By 
mit!) G= BH B +H, Гр 0" МЕЈ! 
ан Ан, h, сат sum 
в. = -1ЕН.В+Н. TEE -a * Mêr! 
xU PH Č + H, š кё — 07! Me) 2 ВА]. 


Die hochgestellten Indices bezeichnen spezielle Unterma- 
trizen von Г bzw. M, [Pâ enthält z. B. die Kovarianzen zwi- 
schen A und 8. Zusätzlich wird angenommen, daß Mp so ge- 
wählt wird, daß der Nenner von Gr positiv definit ist (dies 


ist für ein Minimum notwendig) . 


Den optimalen Wert für (erhalten wir durch partielle 


Differentiation von (8) nach [,_): 


(11) M.S M,+T,_,H,®8E,_,lw 


Т1 )Í 


Wr] ri und M. = 0 

Mp = O impliziert, daß ein endliches Minimum der Zielfunk- 
tion existiert. Die Multiplikatoren M, können in diesem 
Konzept als Preise zusätzlicher Informationen interpre- 
tiert werden. Alle Informationen, die während der letzten 
Periode anfallen, werden nicht mehr benutzt, da keine wei- 
teren Entscheidungen über den Planungszeitraum hinaus ge- 
troffen werden. 


—F-o_ÜO|Ə T 


1)Alternative Schreibweise: 


s= , -1 , „gBB - 1 , 1 BA 
С. = – (Е. (ВН BI- 07! * MB (Е. (BHA) - a! * MBA), 
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Einsetzen von (10) in (9) liefert den optimalen Verlust 
der letzten Periode. Die zu minimierende Zielfunktion des 


anschließenden Zweiperiodenproblems lautet in diesem Fall: 


(12) W. = Ep alte у Нр Ут 2Ур-р р-а t ©т-1 
+Mp_ g- MET "MH: däs 
mit den Riccati Gleichungen: 
(13) H. bat MHA +H, * Гаа —07!* MN 
+ (BH A+H,* ТВА OT *МВАр С. 
hn =hp_, + (A+ BG h. -(AH,C+H,* ГАС DT *м2©| 
+ G (BHC +H, Pius 07! MCD, 
Criar Крат + Mri Мр" EE 


Lë des 2(Bg + + Cz hy 


Е 2g! ВИ Сенте 0-7 м2, 


‘TR! P p28 -1 BB 

+ Bp [BH B +H, * ar DR Мт l&r 
ie ce si cc 

+ 2p [(CH,C+H,* Ei Q “мт DI? 


Da Gleichung (12) die gleiche Form hat wie (7) (nur für T 
jetzt 7-1), kann das obige Verfahren bis zur Bestimmung der 
optimalen Politik u, iterativ fortgesetzt werden, d.h. die 
Gleichungen (10), (11) und (13) liefern optimale Entschei- 
dungsregeln für ue (t = 1,...,T) und optimale Werte für Ee 
(t =1,...,T-1). 
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Der zweite Optimierungsschritt besteht aus der geeigneten 
Wahl der M., so daß die Werte für u, und Г, die "Kovarianz- 
update"-Gleichung erfüllen. Da Mp = 0 kann [p direkt aus der 
Kovarianz-Bedingung für die letzte Periode bestimmt wer- 
den. Die Werte für M,,...,M7_]j werden dann implizit durch 
die Kovarianz-Gleichung für die Periode t=1,...,T-1 berech- 
net, d.h. M),-..,Mr_, und [p werden durch (4) bestimmt. Ins- 
gesamt bedeutet dies für die Lösung des Problems, daß die 
optimale Politik А eine Funktion der vergangenen Zustände 
ge 1 bei gegebenem T,_, und M, ist, dabei werden die Zustän- 
de durch das ökonometrische Gleichungssystem reprä- 
sentiert; T und M sind Funktionen der Zustände y und der 


Politiken u. 


T wird durch (4) bestimmt, M ist durch (11) gegeben. Die 
Lösung des obigen Problems kann mit gewöhnlichen numeri- 
schen Methoden erreicht werden ("Two point boundary value 
problem"). 


Zee Analytische Aussagen (Eigenschaften) über den Kon- 
trollalgorithmus 


In diesem Konzept gibt Р gerade die zur Verfügung ste- 
hende Informationsmenge an, während M, den Preis zusätzli- 
cher Informationen darstellt: М, ist die Ableitung der 
Zielfunktion nach lz š Bei der Bestimmung der optimalen 
adaptiven "feedback"-Regel wird die Matrix М, immer im Zu- 
sammenhang mit Q! verwendet. Die Varianz-Matrix Q reprä- 
sentiert hierbei die Informationsmenge, die aus dem ökono- 
metrischen System erhältlich ist. Ein großes Q bedeutet, 
daß die Systementwicklung äußerst schlecht vorhersagbar 
ist, zusätzliche Beobachtungen bezüglich y und u ergeben 
nur geringfügige Verbesserungen hinsichtlich der Schätz- 


werte der Koeffizienten; der Informationsgewinn (Lernef- 
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fekt) aufgrund zusàtzlicher Beobachtungen ist hierbei sehr 


beschränkt. 


Mac Rae bezeichnet den Term Q! * М, als "value of esti- 
mating". In der Zielfunktion (8) erscheint Q! * м, mit 
einem negativen Vorzeichen. Ein großer Wert von Q! * Mer 
impliziert durch eine kleine Varianzmatrix Q, kann die 
Kosten, die bei der Wahl einer nicht optimalen Politik 
(durch Experimentieren) entstehen, in gewissem Maße redu- 
zieren. Wenn dagegen der Wert von Q! * M. klein ist (das 
Modell ist nicht sehr störanfällig), kann ein Abweichen 
von den optimalen Pfaden zum Zweck verbesserter Schätzun- 


gen zu erhöhten Kosten führen. 


Unterstellen wir ein statisches ökonometrisches Modell, 
d.h. A = 0, so reduzieren sich die Riccati-Gleichungen zu 
H. = К, und h, = к, da Ge = 0. Die Berücksichtigung der 
"Vacianz-update"-Gleichung im Optimierungsprozeß impli- 
ziert jedoch, daß das Entscheidungsproblem dynamisch 
bleibt, selbst wenn ein statisches Modell als Nebenbedin- 
gung verwendet wird. Die analytische Lösung des adaptiven 
Entscheidungsproblems ermöglicht einen Vergleich mit ein- 
fachen Entscheidungsregeln. Um aber überhaupt Aussagen 
über spezielle optimale Politikregeln machen zu können, 
werden im folgenden nur die Algorithmen zur Bestimmung der 
optimalen Entscheidungsregel der ersten Periode unter- 
sucht. Spezialfälle des obigen Ansatzes sind die sicher- 
heitsäquivalente und die stochastische (ohne Lerneffekt) 
Entscheidungsregel. 


Im sicherheitsäquivalenten Fall ist die Varianzmatrix Г, in 
jeder Periode gleich Null, d.h. es gibt keine Unsicherheit 
bezüglich der Parameter, ein Lernprozeß bzw. Informations- 
gewinn ist ausgeschlossen. Dies impliziert sofort, daß der 
Preis zusätzlicher Informationen M, gleich Null ist (d. h. 
м, = 0, Г, = 0 für t = 1,...,T). Diese Entscheidungsregel ist 
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mit der üblichen sicherheitsäquivalenten Lösung identisch. 


Die passive stochastische Entscheidungsregel berücksich- 
tigt dagegen Unsicherheiten in den Parametern (sie werden 
als unabhängige, identisch verteilte Zufallsvariablen in 
jeder Periode modelliert), schließt aber einen Lerneffekt, 
der durch zukünftige Beobachtungen im Planungszeitraum 
entsteht, bei der Ableitung der optimalen Entschei- 
dungsregel von vornherein aus, indem die Varianzen der 
Parameter T, (t = 1,...,T) gleich der a priori Varianz Го 
gesetzt werden. Gleichung (11) impliziert hier jedoch, daß 
M. (t = 1,...,T-1) ungleich Null ist. Da aber die Kontroll- 
regel keinen Einfluß auf das Niveau der Varianzmatrix T, 
hat, wird bei der Bestimmung der optimalen Entscheidung 
die Matrix M,, die ja den Preis zusätzlicher Informationen 
darstellt, nicht berücksichtigt. Die optimale Entschei- 
dungsregel wird analog zur passiven Politik bei Chow 
(1975) berechnet. 


Ein Vergleich der verschiedenen optimalen Politiken bezüg- 
lich der ersten Periode des Planungszeitraums ist im dyna- 
mischen Modell nicht möglich, da die Matrizen H, bzw. h, 
für die unterschiedlichen Entscheidungsmodelle differie- 
ren, die Ursache hierfür liegt in der unterschiedlichen 
Berücksichtigung zukünftiger Informationen. Da das Kon- 
trollproblem rückwärts im Planungszeitraum gelöst wird und 
jeweils gleiche Anfangsbedingungen für Hr und hp unter- 
stellt werden, können die optimalen Entscheidungen für die 
letzte Periode T verglichen werden, jedoch werden diese 
Politiken nicht implementiert, nur jeweils die optimale 


Politik der ersten Periode wird verwendet. 


Da die Information, die während der letzten Periode an- 
fällt, nicht mehr weiter genutzt wird, gilt im adaptiven 


Entscheidungsmodell Mp = 0; die Koeffizienten Gr bzw. gp 
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haben im stochastischen und adaptiven Modell die gleiche 


Form, nur wird Гоу = Го im stochastischen Fall gesetzt. 


Es ist durchaus möglich (siehe Beispiel von Mac Rae), daß 
die adaptive Entscheidungsregel für die erste Periode eine 
vorsichtigere Politik impliziert als die stochastische 
Entscheidungsregel. So kann z.B. die optimale Politik des 
adaptiven Modells darin bestehen, zuerst nichts oder nur 
wenig zu unternehmen, um die relativ hohen Kosten aufgrund 
der anfänglichen größeren Unsicherheit zu vermeiden. Erst 
in späteren Perioden, wenn die Auswirkungen der Ent- 
scheidungen besser bekannt sind, werden verstärkt aktivere 
Politiken durchgeführt. Dies steht im Widerspruch zu Chows 
These, daß die adaptiven Entscheidungsmodelle zu agres- 
siveren Politiken führen als die stochastischen Systeme. 


Im dynamischen Entscheidungsmodell sind analytische Aus- 
sagen über die Größe der verschiedenen Entscheidungsregeln 
äußerst schwierig, da nicht eindeutig bestimmt werden 
kann, ob der Effekt der Varianzen (größere Varianzen in 
den Parametern bedeuten erhöhte Unsicherheit) oder der Ef- 
fekt der Kovarianzen (größere Kovarianzen liefern mehr In- 
formationen) auf die optimale Entscheidungsregel über- 


wiegt. 


Nur im statischen Entscheidungsmodell ist ein Vergleich 
der verschiedenen Entscheidungsregeln unter bestimmten 
Voraussetzungen möglich. Für alle Politiken gilt dann 
нь=К, und h,=k, für t = 1,...,T. Im Gegensatz zum dynamischen 
Modell, wo A, und h, auch den zukünftigen Einfluß der 
optimalen Entscheidung d auf die Verlustfunktion darstel- 
len, kann im statischen Modell nur der gegenwärtige Effekt 
der Politik mit den Riccati-Koeffizienten erfaßt werden. 
Die Entscheidungsregeln d sind für alle Perioden direkt 
vergleichbar, die optimale Politik lautet nun Vuë, Um 


analytische Aussagen über die Größe von g, machen zu 
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können, unterstellen wir, daß die Koeffizientenmatrix cC 
deterministisch ist, also keine Kovarianzen zwischen B und 
C existieren. Bei einer Kovarianz ungleich Null wird ein 
Vergleich äußerst schwierig. Für das adaptive Modell 


ergibt sich somit in der ersten Periode: 


(14) g, =(BH B +H * EI — о”! * МВВ-1 x IPTH G; All. 


Für die stochastische Entscheidungsregel gilt Gleichung 
(14) mit u PB = 0 und für die sicherheitsàquivalente Lösung 
noch zusätzlich Го = o. 


Das stochastische Entscheidungsmodell liefert hier eine 
konservativere (vorsichtiqere) Politik als das sicher- 
heitsäquivalente Modell, da der Wert der stochastischen 
Politik durch Addition des Unsicherheitsfaktors H) * Bech im 
Nenner von g} absolut gesehen kleiner ist als bei der de- 
terministischen Entscheidung. Dagegen stellt die adaptive 
Regel unter den obigen Voraussetzungen eine aggressivere 
Politik als die stochastische Entscheidung dar. Der zu- 
sätzliche Term Q! e нүз, der im Nenner von g, subtrahiert 
wird, impliziert einen größeren Wert für die adaptive 


optimale Politik. 


Ein Vergleich zwischen der adaptiven optimalen Politik und 
der sicherheitsäquivalenten Entscheidung ist nicht mög- 
lich, da keine Aussagen über die relative Größe der 
zusätzlichen Komponenten H, * Bech und Q! * м;88 vorliegen 
und somit unklar ist, welcher Faktor überwiegt. Die adap- 
tive Politik kann deshalb entweder aggressiver oder kon- 
servativer sein als die sicherheitsäquivalente Entschei- 
dungsregel [vgl. Mac Rae (1975)]. 
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Im allgemeinen können nur mit Hilfe numerischer Beispiele 
modellspezifische Aussagen über die Größe einzelner Ent- 


scheidungsregeln gemacht werden. 


2.3 Ein vereinfachter Entscheidungsalgorithmus 


Prescott (1972) leitet für ein einfaches eindimensionales 
Modell optimale Entscheidungsregeln ab, die äquivalent zur 
adaptiven Kovarianzkontrolle von Mac Rae sind. Dabei 
unterstellt er ein ökonometrisches Modell mit nur einem 
unbekannten Parameter, einer Politik- und einer Zustands- 
variablen. Sein Vorgehen ist jedoch für den multivariaten 


Fall wegen der Komplexität des Ansatzes nicht anwendbar. 


Bei einem Vergleich [Prescott (1971)] der sicherheitsäqui- 
valenten mit der dualen Entscheidungsregel kommt er zu dem 
allgemein erwarteten Ergebnis, daß der sicherheitsäquiva- 
lente Ansatz ein adäquates Verfahren darstellt, wenn die 
Unsicherheit in den unbekannten Parametern relativ klein 
ist (Prescott gibt hierfür Werte an), andernfalls, wenn 
die Standardabweichung groß ist, ist der duale Ansatz vor- 
zuziehen. Je länger der Planungshorizont, desto wichtiger 
ist die experimentelle Komponente der adaptiven Kontroll- 


methode. 


3. Numerisches Approximationsverfahren von Chow 


3.1 Der allqemeine Kontrollalqorithmus 


Im folgenden soll ein approximativer dualer Kontrollansatz 
entwickelt werden, der auf dem Chow-Algorithmus basiert 
(e, hierzu Chow (1975) und Abel (1975)]. Dieses Verfahren 
kann in der Praxis ohne große Schwierigkeiten angewendet 


werden. Im Gegensatz zu Chow unterstellen wir als Ziel- 
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funktion die gewöhnliche quadratische und über die Zeit 
additive Verlustfunktion. 


T T 
(15) = ` , = N (- , 
w=e|S (y, — а, K (y,-4,) =E| > ( y Ky, +y k +c) 
t=1 t= 
mit K, = 2K 


> 
N 


-2К a unde =a Ka. 
tt t tt ¢ 


Die letztere Darstellungsweise ist hier vorteilhaft, da im 
folgenden Taylorreihenapproximationen 2. Ordnung verwendet 
werden. Ferner sollen die üblichen Annahmen bezüglich der 
Parameter der Verlustfunktion gelten. Das Entscheidungs- 
problem besteht in der Minimierung von (15) unter der 
Nebenbedingung eines O6konometrischen Systems, das als 
Differenzengleichungssystem 1. Ordnung dargestellt werden 
kann, wobei vorausgesetzt wird, daß die Zustandsvariablen 


ohne Meßfehler in das System eingehen: 


= 1 
(16) ae 


+B u, + C,2, + e. 
Für die stochastischen Parameter A,, B, und C, wird im fol- 
genden ein aktiver Lernprozeß unterstellt. Die additiven 
Störterme e, sind hier normalverteilt mit Erwartungswert 
Null und Varianz 2,, außerdem zeitlich unkorreliert und 
auch unkorreliert mit A,, B, und C,. 

Das Entscheidungsproblem wird nun mit der Methode der 
dynamischen Programmierung gelöst, d.h. die Lösung wird 


rekursiv im Planungszeitraum berechnet. 


1) Bei Chow werden die echt exogenen Variablen nicht be- 
rücksichtigt. 
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Für die letzte Periode T lautet die zu minimierende Ziel- 


funktion: 


l рт BS, 
(17) М = Ер 5 Ут НттУг * ?т hr + c> 


: T _7r То 1) 
mit Нтт = Кт und h =k... 


Mit Er_1I[:] bezeichnen wir, wie bisher üblich, den 
bedingten Erwartungswert E[-|yr_])l, d.h. der Erwartungswert 
wird aufgrund der in Т-1 verfügbaren Information gebildet. 


Einsetzen von (16) in (17) und partielle Differentiation 
nach u, liefert folgende optimale Entscheidungsregel für 
die Periode T: 


A 
(18) r= Gryr_ + gr 


| = “Т -1 брт 
mit G = – (Е. (В, НТВ) (Е. [BHI А) 


ттт TTT 
_ ee -1 ‚ит 
und 87 = -(E,_ [B H FB (E. Br Hr Cp 27 
И, 
+E 118: А1). 


Im Gegensatz zu деп stochastischen Entscheidungsmodellen, 
die einen Lerneffekt bzw. Informationsgewinn aus zukünf- 
tigen Beobachtungen ausschließen - die bedingten Erwar- 
tungswerte E,_,;, werden gleich Eo gesetzt, d. h. die Ver- 
teilungen der stochastischen Parameter werden im Anfangs- 
zeitpunkt als bekannt und zeitinvariant aufgefaßt - ist 
die optimale Entscheidungsregel ú, hier nicht mehr linear 
in Hat, Der optimale Feedbackkoeffizient Gr sowie der 
additive Term gp sind Funktionen der vergangenen Systemzu- 


1) Diese Bezeichnungsweise wird erst später deutlich. 
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stände ут_у,...,уу und Instrumenteinsätze ит_у,...,иу, da sie 
von den bedingten Erwartungswerten zum Zeitpunkt 7-1 abhän- 
gen. Der aktive Lerneffekt besteht hierbei in der Revision 
der Wahrscheinlichkeitsverteilungen der stochastischen Pa- 
rameter aufgrund zusätzlicher Informationen. Die minimalen 
Kosten für die Periode T ergeben sich durch Einsetzen der 
optimalen Entscheidung (18) in (17); sie sind eine nicht- 
lineare Funktion іп уу, ..., Yr_], d.h. es liegt ein nicht- 
lineares Entscheidungsproblem vor. Der Kontrollalgorithmus 
von Chow wird dadurch charakterisiert, daß nun die 
optimale Zielfunktion der letzten Periode durch eine 
Taylorreihe 2. Ordnung approximiert wird, wobei Chow im 
Gegensatz zu anderen Autoren auch die gemischten 
Ableitungen in seinen Ansatz einbezieht. Da die benötigten 
Ableitungen analytisch nur schwer zu berechnen sind, wird 
hier ein numerisches Verfahren gewählt, in dem die 
Veränderungsraten der Funktion bezüglich kleiner Ande- 
rungen in den Variablen уу, ..., He 3 berechnet werden (nume- 
rische Differentiation). Als approximativen Ausdruck der 


optimalen Kosten erhalten wir: 


À T T-1 T-1 
-iN pT x N ani ы з T 
(19) ee — ee A — Me Op 
t = 1 t=ls<¢ t=1 
mit rp = fr + Cp, wobei fr die Konstante der Taylor- 


reihenapproximation darstellt. Die Methode der dynamischen 
Programmierung (Optimalitätsprinzip) erlaubt uns nun, die 
optimale Entscheidung üni zu bestimmen, indem der Erwar- 
tungswert der Verlustfunktion für die letzten beiden Pe- 
rioden minimiert wird unter der Voraussetzung, daß die 
Politik für die letzte Periode schon optimal gewählt ist, 
d.h. 
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1 = A 
(20) w = Е - 


Poi a Gra nra ra E ер 


A 
Wird Wr in (20) durch die Taylorreihenapproximation (19) 


ersetzt, so folgt für die zu minimierende Verlustfunktion 


Wr-]: 
| T-2 
Е 1 | ge 
(21) Wai Erala pe s m m. ms s 
s=1 
у 7-2 
: { T=} — ` DU T 
Pra real Та 
er 
T-2 r-2 
N N «tot ` 
en ГА 
t=! zer t=] 
| Т-1 _ = Tr f Т-1 _ AT . _ 
mit Ho yp 5 Ктр + run Hras = Ory, für sah T-2: 
T-ı _ Т. _ 
һа = krai tar-r тр = тр +" 


d.h. die Terme, die nicht von up_) bzw. Yp-) abhängen, 


werden in dem konstanten Term 4т-1 und der Summenformel 


T-2 T-2 

` NOON Al `x ve 
= == >, Q y, + — Yi q, 
t=1 t=1 s<t t=1 


zusammengefaßt. Nach Einsetzen des ökonometrischen Modells 


(für ур у) in (21) folgt 
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1 
en a ren 


x HT! (A 


-ır-ıAr_ı?T:2 + Вт-1Чт-1 t Cr zr_ (t er) 


+ A,_ 97-2 + Врт t Cr ёгі гот 


Die Minimierung von (22) durch Differentiation nach 


Чт-1 
ergibt: 
Og S G 
(23) “ты тора Spi 
| А ¡pTi =i 
жиб. с ар Baai Arznei e 
rett Tel 
(6. Теа (+8, | 
pT at \-1 
„г> SC GE E Fe 
U T-1 , 
GE Вт Hp ipa rail re + Bn в, 
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Die optimale Entscheidung Р ist hier eine nichtlineare 
Funktion der vergangenen Systemzustände ут_„,...,уу und 
Instrumente ur_,,...,uj. Nach Einsetzen von (23) in (22) 
kann die Erwartungswertkomponente der optimalen Verlust- 
funktion als quadratische Funktion in y),...,y¥p.2 geschrie- 
ben werden, hierzu wird sie durch eine Taylorreihe 2. 
Ordnung approximiert, d. h. für die optimale Verlust- 
funktion der Pefiode T-1 folgt 


À | Т? T-2 
(24) = = `` Ц T-1 Ka Й T-1 
Wri 2 — E yer > — J, q. >; 
rel t=1 set 
T-2 
KEE T-1 
f = >, q, + fr 1 
t=1 
Wéi T-2 T-2 
_ N ‚oT NN SN r x` 
+ 2 = у, 9,19; = — 3 б у. — У,9, + dr 1 
t=1 t=l s<t t=1 
| 7-2 T-2 _ гыў 
SEN ири Мар ы ш S ре 
2 — t Lë t — — t ts — t t 
t=1 (=l s<t t=1 
mit pre! = CET (t=1,..,T-2; 50) 
P, еи + Weil, Te 
гта fr_ tdri 


Das obige Verfahren [Gleichung (19) bis (24)] kann für die 
weiteren Perioden im Planungszeitraum analog durchgeführt 
werden, da Gleichung (24) die gleiche Form hat wie (19), 
nur daß jetzt T-1 anstatt T gilt; für (19) gilt zusätzlich 
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T-l_ pT T_ T . 2 
Q, > und q, =P, für t=1,..,T-1 und s&t. 


Die zu minimierende Verlustfunktion für 
lautet nun 


die Periode T-2 


1 
(25) т = 7 t , T-? ` 
Wr» En 3 2 CEET EC 
T-3 
XY yT-2 E 
+ут_› & Apo, t Ana тә + аә 
s=l 
КЕ T-3 T-3 
I SS oT ST XY caplet , T-1 
+ 5 — Ыы УЕЛ шы к а Р 2 У, Р, 
t=1 t=1 s<t t=1 
mit HT? =K ep! 


Die optimale Entscheidung Bag wird analog zu (23) be- 


rechnet, indem T durch T-1 ersetzt wird. Die optimale Ver- 


lustfunktion der Periode T-2 (genauer von T-2 bis T) 
dann: 


lautet 
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A 1 Т -3 T-3 
_ EE E vara? 
(26) W,_, = ° = У, бе "а > 2 У, gs I; 
t=1 t=1 s<t 
T-3 1 T-3 
x e T-2 1 ,pT-1 
+ Pe >, q, + fp_gt 2 > E eg >, 
t=1 t=1 
T-3 T-3 
© S epl- т 
H — — У, ae I; Ы == >, P, "d 
t=1 set t=1 
1 T-3 T-3 
— — Kä M T-2 є D T-2 
o — >, Pai X, — > 1 ia >, 
t=1 t=1 set 
T-3 
Sy E 
H <= >, p, WC 
t=1 
mit PT? = тета pT-! 
t ts 1,3 
рг 72 = 47 72+ рї! fürt=1,..,T-2,sst 
Fr z= fr-2t4r-z 


Dieses Verfahren läßt sich bis zur Bestimmung der opti- 


malen Politik ú, der ersten Periode fortsetzen. 


46 


3.2 Analytische Aussagen über den Kontrollalgorithmus 


Die Berücksichtigung aktiven Lernens impliziert in diesem 
Ansatz eine alternative Zielfunktion. Durch die Taylorrei- 
henapproximation 2. Ordnung werden Kreuzprodukte von y, und 
ус für Ces in den Optimierungsprozeß integriert, hierdurch 


wird ebenfalls die optimale Entscheidungsregel beeinflußt. 


In den passiven adaptiven Entscheidungsmodellen, die zu- 
künftiges Lernen nicht antizipieren, brauchen keine Appro- 
ximationen bezüglich der Zielfunktion vorgenommen werden, 
da die optimale Verlustfunktion zu jedem Zeitpunkt eine 
quadratische Funktion bezüglich des vorhergehenden System- 
zustands ist. Kreuzprodukte zeitlich unterschiedlicher Zu- 
stände werden dort nicht erzeugt. (Revisionen der Wahr- 
scheinlichkeitsverteilungen der stochastischen Parameter 


werden ignoriert.) 


Im obigen dualen Entscheidungsmodell kann die Taylor- 
reihenapproximation über einen beliebigen Versuchspfad 
entwickelt werden. Oft wird jedoch die sicherheitsäquiva- 
lente oder eine passive adaptive Lösung des Entscheidungs- 
problems als erster Versuchspfad gewählt. Nachdem die 
optimalen Politiken mit dem approximativen Kontrollverfah- 
ren berechnet worden sind (durch Entwicklung der Erwar- 
tungen um den Versuchspfad), kann ein neuer Pfad von 
у1,---,Ут-1 erzeugt werden, der dann als zweiter Versuchs- 
pfad für die Bestimmung einer neuen Lösung des Entschei- 
dungsproblems verwendet wird. Dieses iterative Verfahren 
kann solange fortgesetzt werden, bis Konvergenz für die 
optimale Politik der ersten Periode vorliegt. Bei dieser 
Vorgehensweise ist jedoch aufgrund der beliebigen Wahl 
eines Versuchspfades nicht gewährleistet, daß die berech- 
neten Politiken auch ein globales Optimum darstellen. 


Deshalb ist ein Suchverfahren notwendig. 
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Wie leicht gezeigt werden kann, sind das einfache stocha- 
stische (additiver Störterm) sowie das passive adaptive 
Entscheidungsmodell Vereinfachungen (Spezialfälle) dieses 


approximativen Kontrollalgorithmus. 


Betrachten wir zunächst das passive adaptive Modell. Unter 
den Annahmen, daß die bedingten Erwartungen E, für t=1,...,T 
gleich Boa gesetzt werden und so eine Revision der Ver- 
teilungen von А,, В, und С, ausschließen, kann aus dem obi- 
gen Ansatz die optimale passive Entscheidungsregel 
abgeleitet werden (wir vergleichen nur das Verfahren zur 


Bestimmung der optimalen Politik für die erste Periode). 


Als optimale Entscheidungsregel erhalten wir 


(27) t = G y,_, + 8, für t=1,..,T 
Rote 1-1 З 
mitG, = - (к, (в, н,в, |) р н, А, |) 


рац , -1 r ` ` , 
und з, = - (6 [8/4,8, |) (е, [в, HC, 2, +6, [By] &,) 


In der obigen Notation gilt: 
= gt = pt € — тык . 
H,=H,, und h, =h, (H,,=0 fürt=1,..,T-1,s<o) 


Die minimale Verlustfunktion läßt sich in diesem Fall 


folgendermaßen darstellen: 
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v1 ( Ana ij Е, [4,4,8,6,])9,_, 


yle (a + B.G.) (Ħ,C,z, + dp 


+ е, (8,8, + C,z,) | һ + с, 


t 


1 
+ une 


1 
= г в la, HA, - E, |a, Н,В, 


É, 


е |А Асн, 


ty (ЕАН, С, 


(в.в, + С,г,) H, 


` 1 
x | E(B, H,C,1z, + ЕВА, |) + 5 Е, 


OUER + SÉ | A +c, 


1 
+ TAL H °, 


SCH + SCH 


Die optimale Verlustfunktion 


Ур, deshalb ist keine Approximation notwendig. 


obigen Bezeichnungsweise folgt 


; -1 , 
DI H,8,| DI HA, 


B'H B 
ec eg 


ist bereits quadratisch 


` 


Pes 


a 


in 


Mit der 
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_ nt _ ` , 
(29) Q, ш @,_1\,-1 ~ Ela, H,A,| -e |a, H,B, 


, -1 , 
ХЕ |В, нв е, |в, H,A, 


A, h, = Е, Lang 


ык ; 
q, EREM HC, 


z +Ë, 


, -1 H , 
SD H,8,| oun, H C12, + ЖАП 


i . | 
r = elle +C,2,) н Í B.z, ës 


[4 


1 i ( , 
+ TAR He не (в,в, +С) re 
sowie 


Р! =0 für i<t-1, Tei und q =p =0 für i<t-1. 


ar 
i 


Hieraus folgt sofort, daB 


t 2 pi t E 
Qisa ~ ee und Gp) В 


Für das einfache stochastische Entscheidungsmodell, d.h. 
wenn die unbekannten Parameter A., B, und C, als bekannt 
angenommen werden, also Bol Ap) =А,, Eo(B,)=B, und Eo(C,)=C,, 
ergeben sich analoge optimale Entscheidungsregeln bzw. 
Verlustfunktionen wie in (27) bzw. (28): 


A = Dp? = 1-1 ae = жө: = 
(30) i = -(8, KÉ) IG HĀ, )y, +B, (нб, +) 
fart = 1,..., T. 
und 
A 1 
an Eee ee, 
mit Q = Q! =A/H A - A'H B(B'H B) B'HA 


hiergiltauch Н, = Hip h = h 


(analog zu (29) folgt d. = Р. =0 für i<t-1, jsi, 


4; = р! =0 für i<t—1 und Qei = Ва sowie go, = d, 
Die Unterschiede der einzelnen Verfahren und somit die 
Auswirkungen der verschiedenen Unsicherheitsmaßnahmen kön- 
nen anhand der zu minimierenden Zielfunktionen verdeut- 
licht werden. Die Zielfunktionen differieren dabei jeweils 
(neben der Erwartungswertbildung) in den Riccati-Koeffi- 


zienten Het und hf, für t = 1, .., 7-1 sowie in einer 
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Konstanten, die aber bei der Ableitung der optimalen Ent- 
scheidung keine Bedeutung hat, sondern nur einen Beitrag 


zur optimalen Zielfunktion liefert. 


Nur für die letzte Periode T stimmen die Koeffizienten 
WE bzw. Ke in den drei verschiedenen Kontrollverfahren 
überein. Gleichung (21) impliziert, daß sich die Größen 
Hee und A,fe=l,...,T-1) jeweils aus zwei unterschiedlichen 
Komponenten zusammensetzen; die zu minimierenden Verlust- 
funktionen können zu jedem Zeitpunkt jeweils in eine 
gegenwärtige und eine zukünftige Komponente zerlegt 
werden. Die Koeffizienten К, und k, stellen dabei die 
Gewichte des Beitrags von y, zur Zielfunktion dar, wenn y, 
direkt in der zu minimierenden Verlustfunktion vorkommt; 
sie sind in den drei Kontrollalgorithmen jeweils iden- 
tisch. 
Der quadratrische Term 

1 _ 

t to, Ë, 
repräsentiert somit den gegenwärtigen Anteil von y, an der 
Verlustfunktion. Die zweite Komponente von H, und h 
besteht im einfachen sicherheitsäquivalenten Entschei- 
dungsmodell aus dem Term 


1 $ éi x 
29 @,у,+ У/Ч, ти Q, und q, wie in (31). 


Diese quadratische Funktion stellt die minimalen Kosten 
der zukünftigen Zustandsentwicklung gei, Me dar unter der 
Annahme, daß die zukünftigen Entscheidungen иь, - ‚Up 
schon optimal bestimmt worden sind. Für die zukünftigen 
optimalen Entscheidungen wird ge nur als Anfangsbedingung 
gewählt; die einzige Beziehung von y, zur Zukunft besteht 
in der Beeinflussung der minimalen zukünftigen Kosten in 
der Periode є+1. Da Py jQ; у=0 bzw. р';=4;=0 für i,j < t-l, 
hat у, keine Auswirkungen auf die minimalen zukünftigen 


Kosten der Periode t+2 usw. Ein Vergleich der 
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quadratischen Komponenten der Zielfunktion bzw. der 
Koeffizienten (Ker k.) und (Qe, q.) zeigt die Bedeutung der 
gegenwärtigen und zukünftigen Kostenanteile, die mit dem 
Zustand y, verbunden sind. Die optimale Entscheidung 4, 
wird dann bezüglich der Summe der beiden quadratischen 
Kostenanteile ausgewählt. Mit der obigen Bezeichnungsweise 


gilt hier: 


(32) H,=H' =K + Pte K +Q!'=K,+Q 


Die Zielfunktion im passiven Entscheidungsmodell mit sto- 
chastischen Parametern kann analog dem sicherheitsäquiva- 
lenten Modell in zwei entsprechende Komponenten zerlegt 
werden, die Koeffizienten Q, und q, werden dabei wie in 
(27) berechnet. Die Interpretation ist zum einfachen sto- 


chastischen Modell äquivalent. 


Auch im approximativen dualen Kontrollansatz bleibt die 
Zerlegung der zu minimierenden Zielfunktion in eine gegen- 
wärtige und zukünftige Komponente erhalten. Jedoch sind 
die Effekte von у, auf die optimalen zukünftigen Kosten we- 
sentlich komplizierter, wie die folgende Darstellung zeigt 
[vgl. Chow (1975)]. 


(33) H 


t pr t+1 = t+1 t+2 
= + = + + 
Hy, K, ch K, H. wi 


EE {+1 1+2 T 
=K +Q, +Q, +. +Q, 


t+1 


— ge DEI 
h m h =k Dp, =k +q, 
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Im Gegensatz zu den passiven Entscheidungsmodellen sind 
hier die Terme 0;; bzw. 4; für i<t-1 ungleich Null, d. h. 
der Zustand у, beeinflußt nicht nur die optimalen Kosten 
von der Periode Col an, ег hat zusätzliche Auswirkungen auf 
die optimalen erwarteten zukünftigen Kosten, berechnet vom 
Zeitpunkt t+2, t+3 usw. Der aktive Lerneffekt impliziert 
also, daß u, alle in der Zukunft liegenden optimalen 
erwarteten Kosten bis zum Ende des Optimierungszeitraums 
beeinflußt. 


Ein Vergleich der Effekte von y, auf die optimalen 
zukünftigen Kosten der Periode t+l ( ey 9+1. ) mit den 
entsprechenden Gewichten der anderen Optimierungsverfahren 
zeigt, daß die jeweiligen Größen О, bzw. q, von denen im 
dualen Ansatz differieren, da dieser den Effekt von y, auf 
die a posteriori Verteilungen der stochastischen Parameter 


mitberücksichtigt. 


Die zukünftige Komponente der Zielfunktion, die durch die 
Ausdrücke H,-K, und h,-k, bestimmt ist, ermöglicht nun die 
Auswirkungen von y, auf die optimalen erwarteten zukünf- 
tigen Kosten zu beurteilen, d.h. H,-K, und h,-k, stellen ein 
Kriterium dar, um die Effekte verschiedener Unsicher- 
heitsannahmen auf die Gewichtung der zukünftigen Komponen- 
te der Zielfunktion vergleichen zu können. Ein Vergleich 
zwischen dem dualen und passiven adaptiven Kontrollansatz 
hinsichtlich der zukünftigen Komponente liefert uns ein 
Maß für den aktiven Lerneffekt in der Zukunft. Es ist an- 
zunehmen, daß die Gewichtung der zukünftigen Komponente im 
dualen Entscheidungsalgorithmus wegen der aktiven Lern- 
möglichkeit größer sein wird als im passiven Kontroll- 
ansatz. Eine analytische Bestätigung dieser Annahme ist 
jedoch nicht möglich; es können nur die numerischen Werte 
bei der Ableitung der optimalen Politiken zu einer 


Untersuchung herangezogen werden. 
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3.3 Vereinfachungen (Spezialfälle des Kontrollalgorithmus) 


Eine wesentliche Vereinfachung des obigen Kontrollal- 
gorithmus besteht in der Verwendung einer modifizierten 
Taylorreihenapproximation bei der Bestimmung der optimalen 
Verlustfunktion in jeder Periode [vgl. hierzu Abel 
(1975)1. Das modifizierte Verfahren läuft analog zu dem 
obigen Ansatz, wobei jetzt jedoch die optimalen Kosten der 
einzelnen Perioden in (19), (24) und (26) durch eine 
Taylorreihe 2.Ordnung approximiert werden, die die ge- 


mischten Ableitungen vernachlässigt; in der obigen Be- 


zeichnungsweise bedeutet dies: 01,3 = 0 für izj und 
t=l,...,T. Dies impliziert für die Riccati-Koeffizienten 
Hes = 0 für res und t = 1,...,T-1. Die Modifizierung der 


Taylorreihenapproximation hat so einen direkten Einfluß 
auf die Form der optimalen Entscheidungen. Die Feedbackko- 
effizienten Ge sowie die konstanten Terme g+ für t=1,..., T-1 
haben nun die gleiche Form wie Gr und gp in (18), wobei T 
durch t ersetzt wird. Die optimalen Entscheidungen sind 
jetzt nicht mehr direkt, sondern nur noch über die Erwar- 
tungswertbildung in (23) von allen zeitlich vorhergehenden 


Zuständen abhängig. 


Die modifizierte Form der optimalen Entscheidungen impli- 
ziert für die Approximation der optimalen Verlustfunktion 
natürlıch auch veränderte Koeffizienten; die Berücksichti- 
gung von glatt in (23) führt so zum Beispiel zu einem 
veränderten 071.2 7-2 in (24). 


Dieser Kontrollansatz ist im Vergleich mit der verall- 
gemeinerten Version wesentlich einfacher zu handhaben, da 
die Berechnung einer großen Anzahl zweiter Ableitungen 
wegfällt und so natürlich Rechenzeit eingespart wird. Chow 
bezeichnet dieses approximative Verfahren auch als 
Entscheidungsproblem mit teilweisem Lernen [vgl. Chow 
(1975)]. 


55 


Für den Fall eines quadratischen nichtlinearen Entschei- 
dungsmodells, d.h. Optimierung einer quadratischen Ziel- 
funktion unter der Nebenbedingung eines nichtlinearen 
ökonometrischen Modells, hat Chow (1976, 1981) ein alter- 
natives Approximationsverfahren entwickelt. Bei der Ablei- 
tung der optimalen Entscheidungsregel approximiert er das 
zugrundeliegende nichtlineare System durch eine Taylor- 
reihe 1.Ordnung; das resultierende Kontrollproblem stellt 
dann ein lineares quadratisches Entscheidungsmodell dar, 


das mit dem obigen Verfahren gelöst werden kann. 


3.4 Empirische Untersuchungen 


Empirische Untersuchungen über den Einfluß alternativer 
Unsicherheitseffekte verwenden in den meisten Fällen sehr 
kleine ökonometrische Modelle. Anhand eines einfachen Ein- 
gleichungsmodells (eine Zustands- und eine Instrumentva- 
riable) vergleicht Chow (1975) die folgenden Kontrollalgo- 
rithmen, wobei jeweils die optimale Entscheidung der 


ersten Periode berechnet wird: 


a) sicherheitsäquivalentes Entscheidungsmodell, 

b) stochastisches Entscheidungsmodell ohne Lernmöglichkeit 
(passiv), 

c) stochastisches Entscheidungsmodell mit Lernmöglichkeit 
(aktiv). | 


Die Ergebnisse der Analyse zeigen, daß die verschiedenen 
Entscheidungsregeln zu fast gleichen Werten der optimalen 
Politik führen, d.h. die Berücksichtigung unterschied- 
licher Unsicherheitseffekte impliziert hierbei keine 
bemerkenswerten Abweichungen der einzelnen optimalen 
Lösungen. Die Riccati-Koeffizienten #,, die die Gewichtung 


der zukünftigen Komponente der zu minimierenden quadrati- 
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schen Verlustfunktion darstellen, zeigen, daß die Bedeu- 
tung der zukünftigen Komponenten mit der Einführung von 
Unsicherheit und möglichem Lerneffekt jeweils zunehmen 
(wachsende Koeffizienten von HL). Bezüglich der "Feedback"- 
Koeffizienten existieren ebenfalls Unterschiede. Bei Unsi- 
cherheit ist der Koeffizient G, im Zeitablauf jeweils klei- 
ner als bei der sicherheitsäquivalenten Lösung, d.h. der 
Entscheidungsträger handelt im gewissen Sinne vorsichtiger 
(unter Unsicherheit). Der Koeffizient G, sollte beim akti- 
ven Lernalgorithmus betragsmäßig größer sein als im Modell 
ohne Lernmöglichkeit, da eine aktivere Politik erwartet 
wird; über g, kann ebenfalls eine aktivere Politik in das 


System implementiert werden. 


Zusammenfassend kann festgestellt werden, daß trotz unter- 
schiedlicher Reaktionskoeffizienten die optimalen Politi- 
ken annähernd übereinstimmen. Der geringe Einfluß der Un- 
sicherheitseffekte kann eventuell dadurch erklärt werden, 
daß einerseits die Standardfehler der geschätzten Koeffi- 
zienten klein sind im Vergleich zu den a priori-Schätzun- 
gen der unbekannten Parameter und andererseits der Schätz- 
zeitraum verglichen mit dem Optimierungszeitraum relativ 


lang ist. 


Ein weiteres Anwendungsbeispiel des adaptiven Lernal- 
gorithmus von Chow liefert Abel (1975) in seiner Unter- 
suchung über die relative Effizienz der Geld- und Fiskal- 
politik. Das zugrundeliegende ökonometrische System be- 
steht hierbei aus einem Zweigleichungsmodell mit zwei In- 
strumentvariablen. Die Ergebnisse zeigen, daß die opti- 
malen Instrumenteinsätze nicht sehr auf die Einführung von 
Unsicherheiten bzw. Lernmöglichkeiten reagieren. Die 
Aussagen über die Reaktionskoeffizienten der Entschei- 
dungsregeln sowie die Bedeutung der Zukunftskomponente 
stimmen mit den obigen Resultaten überein. Wenn die 


Standardfehler der geschätzten Koeffizienten größer ge- 
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wählt werden, kann die Berücksichtigung von Unsicherheits- 
effekten zu alternativen, verbesserten optimalen Entschei- 
dungsregeln führen. Es stellt sich dann jedoch die Frage, 
ob nicht Spezifikationsfehler bei der Modellierung des 


ökonometrischen Systems vorliegen. 


4. Adaptive "closed-loop"-Kontrolle (der TBM-Ansatz) 


4.1 Der allqemeine Kontrollalqorithmus 


Ein weit verbreiteter adaptiver Kontrollansatz, der akti- 
ves Lernen bei der Ableitung optimaler Entscheidungsregeln 
berücksichtigt, ist der sogenannte "wide-sense dual 
control"-Algorithmus von Tse, Bar-Shalom und Meier (1973) 
[vgl. auch Tse et al. (1973), Bar-Shalom und Tse (1975), 
(1976), Tse und Bar-Shalom (1973) und Kendrick (1981)]!). 
Dieser kontrolltheoretische Ansatz wird dadurch charak- 
terisiert, daß das Entscheidungsproblem bei Beibehaltung 
der "closed loop"-Eigenschaft in drei Komponenten zerlegt 
wird: 

(1) gegenwärtige Kontrolle, (ii) zukünftige determini- 
stische Kontrolle und (iii) zukünftige stochastische Kon- 
trolle (Perturbationskontrolle), wobei die Perturbations- 
komponente in einen Vorsichts- oder Sicherheitsterm ("cau- 
tion-term") und einen Experimentier- oder Prüfterm ("pro- 
bing-term") aufgespalten wird. Hiermit kann der zukünftige 
Nutzen hinsichtlich des Lernprozesses erfaßt werden. Die 
gegenwärtige Politik kann zukünftige Unsicherheiten der 
Zustände und Parameter beeinflussen bzw. manipulieren, 


d.h. es liegt aktives Lernen vor. 


1) Sowie Bar-Shalom, Tse und Larson (1974). 
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Der folgende Kontrollalgorithmus unterscheidet sich in 
zwei wesentlichen Punkten vom "TBM"-Ansatz. Wir unterstel- 
len ein Zustandsmodell, in dem der Zustand der Periode t 
direkt von der gegenwärtigen Entscheidung u, beeinflußt 
wird, im Gegensatz zum "TBM"-Ansatz, wo die gegenwärtige 
Zustandsentwicklung nur von der um eine Periode verzöger- 
ten Entscheidung ЧР] kontrolliert werden kann. Außerdem 
wird die Zielfunktion im folgenden Verfahren vereinfacht; 
eine direkte Gewichtung der Instrumentvariablen wird nicht 
explizit vorgenommen, der Vektor der Zustandsvariablen 


wird um die Instrumenvariablen erweitert. 


Im folgenden legen wir wieder das allgemeine linear qua- 
dratische Entscheidungsmodell zugrunde, zusätzlich wird 
angenommen, daß die Zustände nicht direkt beobachtbar 
sind, also mit Meßfehlern behaftet sind. Meßfehler werden 
bei der Anwendung kontrolltheoretischer Verfahren auf öko- 
nomische Probleme in der Literatur nur sehr selten 
berücksichtigt, obwohl gerade in den ökonomischen Stati- 
stiken Meßfehler enthalten sind. 


Gesucht ist die optimale Entscheidungsregel й, (t = 1,...,T), 


die den Erwartungswert der quadratischen Verlustfunktion 


(34) W=E 


minimiert unter der Nebenbedingung des Zustandsmodells: 


(35) y,=A,O)y,_,+B(0)u,+CO)z +e, = 1, ..., Т. 


Die Meßgleichung lautet dann dementsprecnend: 
(36) 5, = D(8)y, + v, , t= teed: 


ө. sei hierbei ein Vektor, der die unbekannten (konstanten 
bzw. zeitvarıablen) Parameter des Modells enthält, sie 
sollen linear in A, B, C und D eingehen. Wenn perfekte Beob- 
achtungen unterstellt werden, ist D,(0,)=I und v,=0 (I ist 


Einheitsmatrix). 


Zusätzlich wird angenommen, daß die Zufallskoeffizienten 0, 


einem Markov Prozeß 1. Ordnung folgen; es gilt: 
(37) кек ыеп, 


wobei Р, eine bekannte Matrix und n, eine Zufallsvariable 
ist. Weiterhin wird hier unterstellt, daß die Vektoren e, 
v, л, Yo und 0, gegenseitig unabhängige normalverteilte Zu- 
fallsvektoren sind mit bekannten Erwartungswerten und Va- 


rianz-Kovarıanz Matrizen 
t 0 n vy ob 
Qe R, M,, Ep» Ca 29 
(d. h. positiv semidefinit). 


Ein Lösungsansatz besteht nun darin, die stochastischen 
Parameter als zusätzliche Zustandsvariablen zu definieren. 
Wir erhalten dann ein neues Entscheidungsproblem mit w, als 
erweitertem Zustandsvektor. [Norman (1976) löst das 
Problem, ohne den Zustandsvektor zu erweitern, dabei 


unterstellt er exakte Beobachtungen]: 


(38) с 


Das erweiterte Zustandsmodell lautet: 


E 
BS 


Ан 9) 0 


Е 
š t 


(39) 


Da hier Produkte von Zufallsvariablen vorkommen, kann das 
System nur als nichtlineare Zustandsgleichung dargestellt 


werden?!), d. h.: 


(40) ш, = Héi Woop d er 


Die Varıanz-Kovarianz Matrix von e, bezeichnen wir im fol- 


t 
genden mit Ore 

Die nichtlineare Funktion Ё (ир, We] Ч.) soll hierbei schon 
die Produkte von Ze mit Elementen des Parametervektors Ü. 


enthalten. Aus 


(41) ү= [0,0 0 


folgt die nichtlineare Meßgleichung: s, = d, (We) + v, mit s, 


MeBvektor, ар Meßfunktion und у, Meßfehlerterm. Die Schät- 


t 


zung des Zustandsvektors w, stellt ein nichtlineares Fil- 


t 
terproblem dar. Die gesuchten Schätzwerte für den 
bedingten Erwartungswert Wert = E [w] und die Kovarianz- 
matrix Erst (diese Schreibweise bedeutet: die Kovarianz 
des Zustandsvektors zum Zeitpunkt t, geschätzt mit Daten, 
die bis zum Zeitpunkt t verfügbar sind) können mit Hilfe 
verschiedener approximativer Methoden berechnet werden, 


vorwiegend werden hierbei der "erweiterte Kalman-Filter" 


1) Ausnahme, wenn in A keine unsicheren Parameter vor- 


kommen. 
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(vgl. Sorenson (1966), Bucy (1965), Jazwinski (1970)], der 
"adaptive Filter" [vgl. Jazwinski (1970), Tse et al. 
(1973)], Filter zweiter Ordnung [Tse et al. (1973)] oder 
der "Optimum Filter" [Bucy und Sennes (1970), Alspach und 


Sorenson (1970)] verwendet. 


Die aktualisierten ("updated") Schätzwerte We/e und Ў еу 
sollen eine Approximation des aktuellen Informations- 
standes zum Zeitpunkt t darstellen; die in t zur Verfügung 
stehende Informationsmenge wird also nur durch die Momente 
erster und zweiter Ordnung der Zustandsschätzung charak- 


terisiert. Tse, Bar-Shalom und Meier bezeichnen 


als approximativen "wide-sense"-Informationszustand; die 
Dimension des Informationszustandes bleibt so für alle t 


konstant. 


Um den adaptiven Kontrollalgorithmus zu verdeutlichen, 
wird angenommen, daß sich das System im Zeitpunkt є-1 be- 
findet, d.h. der Entscheidungsträger hat Informationen bis 
zum Zeitpunkt t-l (einschließlich) zur Verfügung. Die Me- 
thode der dynamischen Programmierung verlangt nun, eine 
optimale Politik u, zu finden, die den folgenden Ausdruck 


minimiert: 


A \, ї A 
(42) W = тіп eil, ao, el: D 
t u t t t t t+1 
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Das Hauptproblem besteht nun darin, einen approximativen 
Ausdruck für Weer bei gleichzeitiger Berücksichtigung der 
"closed-loop"-Eigenschaft zu erhalten. Dazu wird ein Nomi- 
nalpfad gewählt, der es erlaubt, den optimalen zukünftigen 
Nutzen Reg (cost-to-go) in einen deterministischen und 
einen stochastischen Teil zu entwickeln. Der stochastische 
Ausdruck stellt dabei ein approximatives linear quadra- 


tisches Problem dar. 


Als Nominalpfad der zukünftigen Zustandsentwicklung ver- 


wenden wir die sicherheitsäquivalente Lösung 1(1=1,..., T), 


Wo 
der Nominalpfad erfaßt natürlich auch die optimalen Kon- 
trollen für die Perioden t+l,...,T, die sich durch die Mini- 
mierung der Verlustfunktion für die Perioden t+l,...,T 
ergeben, wenn aile Zufallsvariablen gleich ihren Erwar- 
tungswerten gesetzt werden. Die Wahl einer zukünftigen 
nominalen Politik ist im gewissen Sinne fiktiv, da sie in 
der Zukunft nicht tatsächlich angewendet wird; sie dient 
lediglich zur Approximation der optimalen "cost-to-go". Um 
aber die sicherheitsäquivalente Lösung bestimmen zu kön- 
nen, benötigen wir als Anfangsbedingung den Wert w,. Dieser 
Zustandsvektor hängt aber gerade vom gegenwärtig gesuchten 
Wert für u, ab; zu jedem Versuchswert von u. gehören 
unterschiedliche Nominalpfade. Normalerweise wird der 
Suchprozeß nach der optimalen Kontrolle á, mit der sicher- 
heitsàquivalenten Kontrollregel begonnen, deshalb ist 


zuerst die Lösung des sichereitsäquivalenten Entschei- 


1) Wobei jetzt a, bzw. K, um 0 erweiterte Vektoren bzw. 
Matrizen darstellen. 
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dungsproblems für den Zeitraum t bis T notwendig. Dieser 
Schritt wird im Optimierungsprozeß oft als Initialisie- 


rungsphase bezeichnet. 


Als Schätzwert für w, verwenden wir HE den erwarteten 
Wert des Zustandsvektors zum Zeitpunkt t bei gegebener In- 
formationsmenge Р! und Versuchspolitik u”. Веі der Be- 
rechnung von GH wird das nichtlineare Gleichungssystem 
wezfelwe,Wwe_j‚ur)re, als Taylorreihe 2. Ordnung um Mei 
(der gegenwärtigen Zustandsschätzung) und u’, (der gegen- 
wärtigen Versuchspolitik) entwickelt. Der gesuchte Schätz- 
wert GE ergibt sich dann durch die nachfolgende Erwar- 
tungswertbildung bzgl. der vorliegenden Information (bis 
zum Zeitpunkt t-l). 


Anschließend wird der Schätzwert ze als Anfangs- 
bedingung für die Lösung des sicherheitsäquivalenten 
Problems benutzt, um den Nominalpfad w,; (i = t+l, ..., T) zu 
bestimmen. Da es sich hier um ein nichtlineares Entschei- 
dungsproblem handelt, müssen nichtlineare Lösungs- 
algorithmen [konjugierte Gradientenmethode (Kendrick und 
Taylor 1970), ftir alternative Algorithmen siehe Athans 
(1972)] zur Berechnung der optimalen sicherheitsäquivalen- 
ten Politiken herangezogen werden. Der optimale zukünftige 
Nutzen in der Periode Col ist eine Funktion der appro- 


ximierten Informationsmenge: 


A 
(43) W =min E, | min, e Je, 
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Mit Hilfe des Nominalpfades w,, ist es möglich, Zei in eine 


deterministische (von Ure] unabhängige) Komponente sowie in 


einen stochastischen Teil zu zerlegen. 


(44) Dy = Гаа + AZ, 
T А 
mit Z = > be -a ук, (w -a ) 
ott 1 — \ ut L t о П 
1= +1 
Т 
AZ = 5 Aw 'K Aw + 2 w a, JK aw | 
t+1 == l L П о { П L 
t=t+1 


und Àu = (4-а) Au =(u-u,) 
L t ot Ë 1 о 


Dabei stellen 2,,, die Kosten bzgl. des Nominalpfades und 
А2,,у die Variation der Kosten über den Nominalpfad dar. 
Der optimale "cost-to-go" Term kann mit der obigen Zerle- 


gung folgendermaßen geschrieben werden: 


A 
(45) W =min E, min, E. (2 


Wir erhalten hier ein separates Optimierungsproblem mit 
quadratischer Zielfunktion (das sogenannte "Perturbations- 
problem"). Die Nebenbedingung der Minimierung folgt aus 
der Taylorreihenapproximation 2. Ordnung des ursprüng- 
lichen Systems, wobei jetzt jedoch die Perturbationsform 
des Gleichungssystems (Schreibweise: Awewe- ot) Verwendung 
findet. 
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Das vorliegende Kontrollproblem besteht nun aus der Mini- 
mierung einer quadratischen Funktion bzgl. eines quadra- 
tischen Systems und ist, wie Bar-Shalom und Tse zeigen, 
dem linear quadratischen Entscheidungsproblem ähnlich. Bei 
Berücksichtigung von Termen bis zu zweiter Ordnung kann 
die Lösung des Problems als quadratische Form dargestellt 


werden: 


A 
(46) Ы: 


В, h und я sind Parameter, die rekursiv aus dem Entschei- 
dungsproblem berechnet werden können. Die optimalen Kosten 
АЙ, ‚| sind hier also eine quadratische Funktion der 
Systemzustände der gegenwärtigen Periode t. Die zugehörige 
optimale Entscheidung Au,,, (optimale Perturbationskon- 
trollregel) läßt sich hierbei als lineare Funktion von 


Aw, darstellen, d. h. 


(47) Au, =G, Abp +8, ' 

Wir verzichten hier auf die Darstellung der Koeffizienten 
Ge bzw. Tei sie können rekursiv im Planungszeitraum berech- 
net werden. Die optimalen Perturbationskosten (Gleichung 
46) können unter Verwendung zukünftiger Unsicherheiten um- 
geformt werden in [siehe Bar-Shalom und Tse (1976), 
Kendrick (1981)]: 


A 
(48) AW = Kea TE [а.ш + Aw; H, дш, 
T 
< 
+ BI EN, | 


Le und N. sind Koeffizientenmatrizen, die sich rekursiv 
berechnen lassen. Q, stellt die Varianz-Kovarianzmatrix des 


Störterms des erweiterten Gleichungssystems dar und 


A A Y 
(49) ug = E, (aw, + ai. )( мв, Ы A, | 


' + tr N Eu | 


und АЕ Aw | =A ON АШ 
t t t t tt t t 


Setzen wir nun (48) bzw. (45) in (42) ein, So ergibt sich 
für den Zeitpunkt t folgende "closed-loop optimal expected 


cost-to-go": 
СЕСЕ 
(50) Е w,-4,)K, SERA FA Seen 


+ Аш, нуш, | 


h,,, Аш, 
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Da für die Informationsmengen # 2 Pgilt, folgt 


(51) e Je 


(52) E 


A 
Aw 1 Kë? GH 


wine -1 H, +1 tit 


A — 
= |Н аа Аш, _ = 0. 


1 


Е) 


Einsetzen von (52) in (50) liefert, wenn gleichzeitig der 
Erwartungswert gebildet wird und nur von u, abhängige Terme 
berücksichtigt werden: 


A 
(53) к (ua }к,(в„-,) Шы sa д 
Т 
x e D 
E ve déen ln |н Al 
t=t+1 


Der Ausdruck der approximativen optimalen Kosten kann also 


in drei Komponenten zerlegt werden [siehe Bar-Shalom und 
Tse (1976)]: 


— = 
1) Wot t/t-1 
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A 
(54) т Bb Же og 


mit einer deterministischen Komponente (gegenwärtige und 
zukünftige) 


T | 
_ [ ‚ ' " 
(a) эа _ w va jk (w, а) ры 


einer Sicherheitskomponente 


T 
(b) u e ` 
Wes EIN Zar 2 |Le, 

i=t+1 

und einer Prüfkomponente 
T 
= “М e 
(e) Wir en | 
ET A) 


Hierbei enthält W,; neben den gegenwärtigen determi- 
nistischen Kosten auch die zukünftigen deterministischen 
Kosten (bzgl. des Nominalpfades), d.h. die deterministi- 
schen Kosten sind nur eine Funktion der gesuchten opti- 
malen Politik a. und des Nominalpfades; Kovarianzterme ha- 


ben keinen Einfluß auf die deterministische Komponente. 


l) Kendrick (1981) zeigt, daß hier Y = 0 gilt. 
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Die stochastischen Einflüsse der Kontrolle auf die 
Zielfunktion werden durch die Sicherheitskomponente und 
den Prüfterm dargestellt. Die Sicherheitskomponente ist 
sowohl eine Funktion der Kovarianzmatrix der Zustands- 
variablen (erweiterter Vektor) zum Zeitpunkt t vorhergesagt 
mit verfügbaren Daten zum Zeitpunkt t-l: Ёк/е-1, als auch 
eine Funktion der Kovarianzen der Störterme des Glei- 
chungssystems bzgl. zukünftiger Perioden. Die Unsicher- 
heitsterme Qtr- -Qr können durch u, nicht beeinflußt 
werden, nur ihre Gewichte hängen von der Wahl bzgl. u, ab. 
Die Kovarianzmatrix Lea) stellt also die Unsicherheit der 
Systemzustände bei Anwendung einer Politik u, dar, bevor 
die Systemzustände im Zeitpunkt t wieder beobachtet werden 
können. Die Bezeichnung "caution term" kommt daher, daß 
der Entscheidungsträger unsicher über die Größe der Sy- 
stemreaktion ist und deshalb eine konservativere (vor- 
sichtigere) Politik wählt. Die Kovarianzmatrizen Q sollten 
besser als separate Komponente behandelt werden, da sie, 
wie Kendrick (1981) feststellt, nicht in dieses Konzept 


passen. 


Der Prüfterm erfaßt Unsicherheitseffekte, die durch nach- 
folgende Entscheidungen verursacht werden. Die Bezeichnung 
"probing term" soll hierbei verdeutlichen, daß durch Expe- 
rimentieren zu Beginn des Planungszeitraumes Unsicher- 
heiten hinsichtlich zukünftiger (späterer) Kovarianz- 
matrizen Desi reduziert werden können. Die Gewichtungs- 
matrix N; wird auch der "Wert zukünftiger Information" 


1 
genannt. 


Die Berechnung der zukünftigen Kovarianzmatrizen Lisi 
("projecting") geschieht hier durch sukzessive Anwendung 
des Kalman Filters. Dieser Prozeß ist vom sogenannten 
"updaten" zu unterscheiden, obwohl in beiden Fällen der 


gleiche Ansatz verwendet wird. 
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Tse, Bar-Shalom und Meier benutzen jeweils einen Kalman 
Filter zweiter Ordnung. Das "updaten" wird nur einmal pro 
Zeitpunkt durchgeführt, während die Anzahl der "project- 
ing" Vorgänge von der Zahl der Suchschritte in einem Zeit- 


punkt abhängt. 


Die Minimierung der Zielfunktion А ermöglicht nun einen 
Kompromiß zwischen den einzelnen Komponenten, d.h. es 
findet ein Ausgleich zwischen dem zukünftigen Nutzen bei 
Berücksichtigung zusätzlicher (zukünftiger) Informationen 
(Lerneffekt) und den Kosten der gegenwärtigen Kontrolle 
statt. 


Zur Lösung des Entscheidungsproblems im Zeitpunkt t werden 
wiederholt verschiedene Werte für u, gewählt, für die dann 
jeweils die approximativen "cost-to-go" Funktionen berech- 
net werden. Da u, in den meisten Fällen einen mehrdimen- 
sionalen Vektor darstellt, können zur Bestimmung der opti- 
malen Entscheidungsregel Gradientenverfahren oder "grid 
search" Methoden herangezogen werden. Hierbei müssen je- 
doch verschiedene Startpunkte gewählt werden, weil mehrere 
lokale Optima auftreten können [siehe hier z.B. Kendrick 
(1981)]. Diese Verfahren werden solange fortgesetzt, bis 


Konvergenz erreicht ist. 


Anschließend wird die optimale Entscheidung ur zusammen mit 
dem additiven Störterm e,, der durch eine Monte Carlo Pro- 
zedur mit Hilfe der Kovarianzmatrix Or erzeugt wird (dem- 
entsprechend werden auch die restlichen Zufallsvariablen 
erzeugt), benutzt, um ge zu berechnen. Der Zustand w, wird 
wieder in die Meßgleichung eingesetzt (zusammen mit einem 
erzeugten Wert für у), um Se zu bestimmen. Der Meßvektor 
se wird schließlich in einem erweiterten Kalman Filter 
Ansatz verwendet, um aktualisierte ("updated") Schätzwerte 
für den Erwartungswert Wert und die Varianz Lo zu 


ermitteln, die dann den Informationszustand fiir die 
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Bestimmung der optimalen Entscheidungsregel Dee) darstel- 


len. 


Der obige adaptive Kontrollalgorithmus kann so in jedem 
Zeitpunkt ın drei verschiedene Schritte (Prozeduren) 
unterteilt werden. An die Initialisierung des Suchprozes- 
ses (im allgemeinen die Bestimmung der optimalen sicher- 
heitsäquivalenten Entscheidungsregel für die Periode с) 
schließt sich der eigentliche Suchprozeß an; dieser 
iterative Prozeß besteht hauptsächlich aus der Berechnung 
der optimalen "cost-to-go" Komponenten, die mit Hilfe 
eines Nominalpfades (sicherheitsäquivalente Lösung für den 
Zeitraum t+l bis T) entwickelt werden können. Die Riccati 
Koeffizienten werden rekursiv im Planungszeitraum berech- 
net, das "projecting" der Kovarianzen wird dagegen vor- 


wärts im Optimierungszeitraum durchgeführt. 


Nachdem Konvergenz vorliegt (Gradientenverfahren) oder 
alle Suchpunkte entwickelt worden sind ("grid search"), 
wird das "updating" durchgeführt, um aktualisierte Schätz- 
werte der Zustände und Parameter für die folgende Periode 


t+l zu erhalten. 


Diese drei Schritte werden für jeden Zeitpunkt bis zur 


letzten Periode wiederholt. 


Um aber Vergleiche mit anderen Kontrollmethoden vornehmen 
zu können, muß eine Vielzahl von Monte Carlo Läufen, in 
denen die erforderlichen Zufallsterme des Entscheidungs- 
problems erzeugt werden, durchgeführt werden; wegen der 
benötigten Rechenzeit ist dieses Vorgehen aber sehr 
kostenintensiv, man beschränkt sich deshalb auf nur wenige 


Monte Carlo Läufe. 
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4.2 Vereinfachungen des Kontrollansatzes 


Die empirische Anwendung des TBM-Ansatzes führt in der Praxis 
aufgrund der notwendigen umfangreichen Berechnungen bei gro- 
ßen Modellen zu rechentechnischen Schwierigkeiten (Rechen- 
zeit, Speicherplatz). Um diese Probleme zu vermeiden, können 
bestimmte Vereinfachungen im Approximationsverfahren vorge- 
nommen werden. So verwendet Norman (1976, 1979) im Gegensatz 
zum TBM-Ansatz nur Momente erster Ordnung; Momente zweiter 
Ordnung, die die Kovarianzen zwischen den Zustandsvariablen 
und den stochastischen Parametern betreffen, werden bei der 
Ableitung der zukünftigen Perturbationskomponente vernach- 
lässigt. Zusätzlich unterstellt Norman, daß die Zustands- 
variablen ohne Meßfehler beobachtet werden können, d.h. sie 
werden exakt gemessen. Die Anwendung des TBM-Ansatzes bei 
exakten Beobachtungen ist nach Norman (1979) inkonsistent mit 
dem Konzept, daß alle Terme bis 2. Ordnung bei der Ent- 
wicklung der stochastischen "cost-to-go" Komponente verwendet 
werden. Norman untersucht zwei alternative Vorgehensweisen 
hinsichtlich einer "first order"-Methode. Dabei zeigt sich, 
daß die Version, in der die unbekannten Parameter in den 
Zustandsvektor integriert werden, der "nicht integrierten" 


Version statistisch sowie rechentechnisch unterlegen ist. 


Die Aufteilung des Entscheidungsproblems in drei Komponenten 
(gegenwärtige Kontrolle, zukünftige deterministische und zu- 
künftige Perturbationskontrolle) bleibt auch bei den approxi- 


mativen dualen Verfahren erster Ordnung erhalten. 


Der TBM-Ansatz unterscheidet sich vom Chow-Algorithmus durch 
mehrere Annahmen. So unterstellt der Chow-Ansatz, daß die Zu- 
standsvariablen perfekt gemessen werden. Die Bewertung der 
Verluste wird dabei durch eine sehr allgemeine quadratische 
Zielfunktion vorgenommen, die auch im Gegensatz zum TBM- 
Kontrollalgorithmus Kreuzprodukte unterschiedlicher Zeitpe- 
rioden berücksichtigt. Ein wesentlicher Unterschied liegt in 
dem Verfahren, wie die Taylorreihenapproximationen zweiter 


Ordnung entwickelt werden. Im Chow-Algorithmus wird der Ver- 
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suchspfad exogen vorgegeben, im TBM-Ansatz ist die Berechnung 
des Pfades endogen; nach jeder Iteration wird der Pfad neu 
bestimmt. Außerdem werden im Chow-Ansatz dıe Erwartungswerte 
vor dem Approximationsverfahren gebildet, während bei Tse, 
Bar-Shalom und Meier die umgekehrte Reihenfolge gilt; d.h. 
vor der Erwartungswertbildung wird dort die Zielfunktion 


durch eine Taylorreihe 2. Ordnung approximiert. 


4.3 Empirische Anwendungen 


Bar-Shalom und Tse (1976) sowie Kendrick (1981) zeigen anhand 
eines einfachen Entscheidungsmodells unter Verwendung des 
TBM-Ansatzes die unterschiedliche Bedeutung der einzelnen 
Komponenten der optimalen "cost-to-go" Terme. Ausgangspunkt 
der Untersuchungen ist das sogenannte "MacRae Problem" [siehe 
hierzu MacRae (1972)], ein eindimensionales Modell mit unbe- 
kanntem, zeitinvariantem Koeffizienten bzgl. der Instrument- 
variable, perfekt gemessenen Systemzuständen und einem 


Optimierungszeitraum von 2 Perioden. 


Die deterministische Komponenten, die man erhält, wenn die 
sicherheitsäquivalente Lösung als Nominalpfad (Entwicklungs- 
pfad) genommen wird, überwiegt hierbei die beiden sto- 
chastischen Komponenten eindeutig. Die Sicherheitskosten 
stellen eine monoton Steigende Funktion der Entscheidung in 
der ersten Periode dar; d.h. bei steigendem Instrumenten- 
einsatz nımmt der Sicherheitsanteil zu; aufgrund des 
unbekannten Instrumentenkoeffizienten vergrößert sich die Un- 
sicherheit. Die Prüfkosten (experimentelle Komponente) sind 
dagegen eine monoton fallende Funktion in der ersten Periode; 
eine Zunahme des Politikeinsatzes impliziert abnehmende 
Prüfkosten und somit genauere Schätzungen für die folgende 
Periode. Das Verhalten der stochastischen Komponenten 
verläuft (in der ersten Periode) entgegengesetzt. In diesem 
Fall liegt der optimale Politikeinsatz der ersten Periode 
unterhalb der deterministischen Lösung, da die Sicherheits- 


kosten bei weitem die Prüfkosten übersteigen. 
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Kendrick (1981) erweitert das Modell, indem er auch die 
übrigen Koeffizienten als unbekannt annimmt und den Planungs- 
zeitraum variiert. Die obigen Aussagen über die Bedeutung der 
Komponenten in der Zielfunktion verlieren im erweiterten Mo- 
dell jedoch ihre Gültigkeit. Aussagen sind jeweils nur 
problemspezifisch möglich, d.h. sie hängen von der Spe- 
zifizierung des Entscheidungsmodells (Unsicherheitsannahmen, 
Planungszeitraum etc.) sowie von der Durchführung der Monte 


Carlo Simulationen ab. 


Als weiteres Anwendungsbeispiel untersucht Kendrick ein 
kleines d6konometrisches Modell der USA, das aus zwei 
Zustands- und zwei Kontrollvariablen besteht, sowie zehn 
unbekannten Parametern, wobei auch Meßfehler zugelassen sind. 
Die stochastischen Parameter werden als unbekannt, aber 


konstant modelliert. 


Ein Vergleich alternativer Kontrollansätze zeigt, daß in 
diesem Modell der aktive Lernansatz den passiven Methoden, 
einschließlich dem sicherheitsäquivalenten Lösungsverfahren, 
nicht unbedingt überlegen ist; der rechentechnische Aufwand, 
der beim aktiven Kontrollverfahren notwendig ist, steht in 
keinem Verhältnis zum resultierenden Lerngewinn. Kendrick 
führt diese Tatsache teilweise auf die Modellierung der 
stochastischen Parameter (Annahme konstanter Koeffizienten) 
zurück. Die Kovarianzen in der Startperiode sind zu gering, 
so daß aktives Lernen keine sichtbaren Vorteile (Verbesserung 
der Parameterschätzungen) liefert. Bei Annähme zeitvarianter 
Parameter kann dagegen die approximative duale Kontroll- 
methode den passiven Ansätzen überlegen sein, da aufgrund 
größerer Kovarianzen zu Beginn des Planungszeitraumes die 
Möglichkeit zum verstärkten Lernen besteht; damit kann sich 
der anfängliche Informationsgewinn in späteren Perioden posi- 
tiv auswirken. Die Länge des Planungszeitraumes spielt des- 


wegen bei den aktiven Lernansätzen eine große Rolle. 


Tse, Bar-Shalom und Meier (1973) und Tse (1974) kommen in 
ihren Untersuchungen zu dem Ergebnis, daß der duale Kontroll- 
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ansatz wesentlich bessere Resultate (in Termini der Kosten) 
liefert als die sicherheitsäquivalente Kontrolle. Die Berück- 
sichtigung stochastischer Effekte ermöglicht hier im gewissen 


Sinne "zuverlässigere" Kontrollen bzw. Politikeinsätze. 


5. Alternative adaptive Kontrollalgorithmen 


In der Literatur werden neben den oben ausführlich disku- 
tierten approximativen adaptiven Kontrollansätzen noch alter- 
native Verfahren behandelt. Einen Überblick über adaptive 
Entscheidungsmodelle geben Kendrick (1976, 1981), Pekelman 
und Rausser (1978) und Rausser und Hochman (1979). Die ein- 
zelnen approximativen Kontrollalgorithmen basieren dabei 
jeweils auf speziellen Annahmen bzgl. des zugrundeliegenden 
ökonometrischen Modells, der zu minimierenden Zielfunktion 
und der unterstellten Unsicherheiten [siehe hierzu Aoki 
(1967), Saridis und Lobbia (1972), Wieslander und Wittenmark 
(1971), Murphy (1968), Gorman und Zaborszky (1968), Deshpande 
et al. (1972), Upadhyay (1975), Taylor (1973)]. 


Wegen der Komplexität der verschiedenen adaptiven Kontroll- 
algorithmen ist es analytisch äußerst schwierig, allgemein- 
gültige Aussagen über die Güte alternativer Kontrollansätze 
zu machen. Nur mit sehr speziellen, einschränkenden Annahmen 
ist eine Beurteilung der unterschiedlichen Entscheidungsalgo- 
rithmen möglich, generell kann nicht entschieden werden, ob 
die duale Methode dem passiven bzw. dem sicherheitsäquiva- 


lenten Kontrollansatz überlegen ist. 


Empirische Vergleiche alternativer stochastischer Entschei- 
dungsansätze sind einfacher durchzuführen [vgl. Kendrick 
(1981, 1979), Bar-Shalom und Tse (1976), Chow (1975), Abel 
(1975), MacRae (1972), Noman (1976), Prescott (1971), Sarrıs 
und Athans (1973), Zellner (1971)]. 


Einschränkend ist jedoch hierzu zu sagen, daß in der Lite- 
ratur die Vergleiche einzelner Kontrollmethoden nur mit 


wenigen Monte Carlo Simulationen (wegen Rechenkosten) und 
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meistens mit unterschiedlicher Datenbasis vorgenommen werden, 
so daß Aussagen über die Güte verschiedener stochastischer 
Kontrollalgorithmen jeweils nur problemspezifisch, d.h. an- 
hand des vom speziellen Autor verwendeten konkreten Entschei- 
dungsmodells, gemacht werden können. Da die Autoren jeweils 
von unterschiedlichen Voraussetzungen bzgl. des Entschei- 
dungsproblems ausgehen, existiert keine eindeutige Rangfolge 
für die suboptimalen approximativen dualen Kontrollal- 
gorithmen. 

In der Literatur gibt es nur sehr wenige Untersuchungen, die 
alternative suboptimale aktive Lernansätze miteinander ver- 
gleichen. Bar-Shalom und Tse (1976) verwenden das "MacRae 
Problem", um die Güte bzw. Rangfolge der einzelnen adaptiven 
Kontrollalgorithmen beurteilen bzw. feststellen zu können. 
Dabei werden die optimalen Lösungen der ersten Periode sowie 
die optimalen Kosten jeweils für sechs verschiedene Algo- 
rithmen berechnet. Neben den approximativen Ansätzen von Tse, 
Bar-Shalom und Meier, Chow und MacRae werden auch die 
sicherheitsäquivalente, die "open-loop feedback" und die 
optimale Lösung (erhalten durch eine Vielzahl von Monte Carlo 
Läufen) zur Beurteilung der Leistungsfähigkeit der alter- 


nativen Kontrollmethoden herangezogen. 


Die Ergebnisse zahlreicher Monte Carlo Simulationen zeigen, 
daß kaum Aussagen über die Güte verschiedener Algorithmen und 
somit über die Berücksichtigung und Verarbeitung unterschied- 
licher Unsicherheitsannahmen gemacht werden können. Bei den 
aktiven Lernansätzen ist keine Überlegenheit einer Methode zu 
erkennen, es kann lediglich eine Überlegenheit der aktiven 
Ansätze gegenüber dem sicherheitsäquivalenten Verfahren 
festgestellt werden. Gegenüber dem "open-loop feedback" 
Algorithmus ist kein eindeutiges Verhalten mehr erkennbar, 
d.h. beim vorliegenden Entscheidungsmodell besteht nur in ei- 
nem sehr begrenzten Maße die Möglichkeit, bzgl. der Unsi- 
cherheiten durch Experimentieren zu lernen. Ein Grund für das 
relativ unbefriedigende Abschneiden der aktiven Lernal- 
gorithmen kann in der geringen Länge des Optimierungs- 


zeitraumes bestehen. 
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Norman (1979) erweitert diese Untersuchung alternativer sub- 
optimaler Entscheidungsregeln um die aktiven Lernalqorithmen 
"erster Ordnung". Dabei zeigt sich, daß die "open-loop 
feedback" Regel in einigen Fällen durchaus bessere Resultate 


liefert als die dualen Methoden von Norman. 


Wenn die Rechenzeiten bzw. die Rechenkosten zur Beurteilung 
alternativer Lernalgorithmen herangezogen werden, stellt die 
duale Methode von Norman, die den Zustandsvektor nicht um die 
stochastischen Parameter erweitert, das "beste" bzw. 
"effektivste" aktive adaptive Kontrollverfahren dar. Diese 
Tatsache ist besonders wichtig im Hinblick auf größere 


Entscheidungsmodelle. 
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Stabilisierungspolitik im Rahmen eines 
stochastischen Kontrollansatzes: eine empirische Analyse 
für die Bundesrepublik Deutschland 


Wolfgang Franz 
Theo Kempf 
Horst Krager 


Is Einführung 


Dieser Beitrag beschäftigt sich im Rahmen eines kontroll- 
theoretischen Ansatzes mit der Bedeutung wirtschaftspoli- 
tischer Entscheidungsregeln für die Stabilisierungspolitik. 
Konkret wird mit Hilfe eines kleinen 6konometrischen Modells 
der bekannte Zielkonflikt zwischen Inflation und Arbeits- 
losigkeit analysiert, wobei im Gegensatz zur Simulation 
eines ökonometrischen Modells die kontrolltheoretische Me- 
thode die Vorgabe wirtschaftspolitisch gewünschter Zeitpfade 
der endogenen Variablen sowie der Instrumentvariablen ermög- 
licht. Somit können in Verbindung mit einer Zielfunktion die 
Effekte alternativer Stabilisierungspolitiken auf die ge- 
nannten Variablen evaluiert werden, wobei sich die einzelnen 
Strategien im wesentlichen durch die Höhe der Gewichtung, 
mit denen die Zielvariablen an den vorgegebenen Optimalpfad 


angepaßt werden, voneinander unterscheiden. 


Die Requisiten für eine informierte Diskussion alternativer 
wirtschaftspolitischer Maßnahmen sind zunächst ein ökonome- 
trisches Modell der zu analysierenden Okonomie, damit über- 
haupt gezeigt werden kann, ob und inwieweit und mit welcher 


Wahrscheinlichkeit eine alternative Politikaktion zu ver- 
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schiedenen und präferableren Zielerfüllungsgraden führt.?) 
Ein solches Modell wird im übernächsten Abschnitt 3 
vorgestellt, während das folgende Kapitel 2 sich mit der 
grundsätzlichen Kritik auseinandersetzt, die an Politik- 
simulationen mit Hilfe ökonometrischer Modelle (mit oder 
ohne kontrolltheoretischem Ansatz) insbesondere von den Ver- 


fechtern rationaler Erwartungen geübt wurde. 


Weitere Elemente für eine Politikevaluation sind sowohl ein 
Ziel- respektive Kostenfunktional für die relevanten бкопо- 
mischen Variablen sowie eine Berücksichtigung von Un- 
sicherheit, d.h. eine Offenlegung der Wahrscheinlichkeits- 
verteilung des Nutzens bzw. Verlustes, der aufgrund der 
Politikaktion entsteht. Zusammen mit einigen Hinweisen auf 
die methodische Vorgehensweise wird auf diese Probleme im 
Abschnitt 4 eingegangen. Empirische Resultate der Berech- 
nung eines "trade-off's" zwischen Arbeitslosigkeit und In- 


flation werden in Abschnitt 5 vorgestellt. 


2. Zur Relevanz von Politiksimulationen mit 6konome- 
trischen Modellen 


Sowohl 6konometrische Modelle als auch der kontrolltheo- 
retische Ansatz sind in letzter Zeit als Mittel zur 
Simulation wirtschaftspolitischer Maßnahmen diskreditiert 
worden: "... modern macroeconomic models are of no value 
in guiding policy" 2) und "... for the aggregate demand 
management problem, it is shown that the application of 
optimal control theory is equally absurd, at least if 


expectations are rational.3) Das Argument lautet, daß die 


1) Siehe Chow (1981, S. 123). 
2) Siehe Lucas und Sargent (1978, S. 50). 
3) Siehe Kydland und Prescott (1977, S. 475). 
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gegenwärtigen Entscheidungen der handelnden Wirtschafts- 
subjekte zum Teil auch von ihren Erwartungen bezüglich der 
zukünftigen wirtschaftspolitischen Aktionen beeinflußt 
werden. Die derzeitige Anwendung einer bestimmten wirt- 
schaftspolitischen Maßnahme - z.B. expansive Fiskalpolitik 
anstatt Konsolidierung des Staatshaushalts - läßt die 
Wirtschaftssubjekte mit größerer Wahrscheinlichkeit z. B. 
künftige Steuererhöhungen erwarten, mit der Folge, daß, 
soweit möglich, zukünftig geplanter Konsum (im Fall einer 
Mehrwertsteuererhöhung) respektive zukünftig geplantes Ar- 
beitsangebot (im Fall einer Einkommensteuererhöhung) zeit- 


lich vorgezogen werden. 


In einer etwas präziseren Argumentation mögen yt den zum 
Zeitpunkt t herrschenden Zustand der Ökonomie (unter Einbe- 
ziehung ihrer Historie) und xe einen Vektor wirtschafts- 
politischer Maßnahmen bezeichnen, die im Zeitpunkt c er- 


1) In jedem Zeitpunkt ¢ existiere eine Funk- 


griffen werden. 
tion gy, die die Wahrscheinlichkeitsverteilung von gei іп 
Abhängigkeit von y, und x, bestimmt, d.h. den Zustand der 
Ökonomie im Zeitpunkt roi Im Rahmen des kontrolltheo- 
retischen Ansatzes ist x, der Vektor der Werte für die 
Kontrollvariablen und g, eine bei der Optimierung der 
wirtschaftspolitischen Strategien gegebene Funktion, die 
durch die Verhaltensgleichungen des der Untersuchung zu- 


grundeliegenden ökonometrischen Modells beschrieben wird. 


Genau hier setzt die eingangs genannte Kritik ein. Bei ge- 
gebenen у, und x, können sich die Wirtschaftssubjekte ganz 
unterschiedlich verhalten, je nachdem welche wirtschafts- 
politische Aktion Xe+s (S>0) sie für die Zukunft erwarten. 
Es gibt mithin auch keine Funktion ge, d.h. kein 6kono- 
metrisches Modell, das іп der Lage wäre, убу allein 


aufgrund von ye und хь (d. h. der Variablen eines 6kono- 


1) Zu den folgenden Ausführungen siehe auch Sims (1982). 
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metrischen Modells) zu bestimmen, sondern es fehlt immer 
die Information darüber, welche Erwartungen die Wirt- 
schaftssubjekte über rs haben. M.a.W. die Strukturglei- 
chungen des ökonometrischen Modells sind nicht invariant 
gegenüber Veränderungen der Zukunftserwartungen der Wirt- 
schaftssubjekte. Hinzu kommt, daß beim dynamischen Ansatz 
der Kontrolltheorie eine optimale Sequenz von ye+s und Xt+s 
(bei gegebenen uc und xe) ermittelt wird. Insoweit die 
Wirtschaftssubjekte xt+s kennen (weil sie z. B. rationale 
Erwartungen haben), ändern sich ihre Verhaltensweisen, und 
die berechneten Simulationsergebenisse sind kaum noch aus- 
sagekräftig. Wenig überraschend ist daher die wirtschafts- 
politische Folgerung, die von den Protagonisten rationaler 
Erwartungen gezogen wird: da die Wirtschaftssubjekte auf- 
grund der Revision ihrer Erwartungen bei neu verkündeten 
wirtschaftspolitischen Maßnahmen nicht in der gewünschten 
Weise reagieren, sind feste Regeln optimal, diskretionäre 


Maßmahmen hingegen suboptimal.!) 


Die vorgetragene Kritik beruht nicht notwendigerweise auf 
der Gültigkeit rationaler Erwartungen und ist daher nicht 
damit zu entkräften, daß rationale Erwartungen in ihrer 
strengen Form nicht rational sind, weil sie die Kosten der 
Informationsbeschaffung und der ständigen Aktualisierung 
des O6konometrischen Modells vernachlassigen [Feige und 
Pearce (1976), B. Friedman (1979)]. Für die Argumentation 
ist es ausreichend zu unterstellen, daß "agents have some 
knowledge of how policymakers' decision will change as a 
result of changing economic conditions"). 


1) Für einen formalen Nachweis siehe Kydland und Prescott 
(1977). 


2) Siehe Kydland und Prescott (1977, S. 474). 
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Ein Plädoyer für eine Relevanz von Politiksimulationen 
kann mithin die Gültigkeit der vorgebrachten Argumente 
nicht prinzipiell in Abrede stellen, sondern ihre Bedeu- 
tung angesichts der Realität wirtschaftspolitischer Ent- 
scheidungen zu relativieren versuchen [Sims (1982)]. Wirt- 
schaftspolitik wird auf verschiedenen Ebenen der Gebiets- 
körperschaften betrieben, und zwar bekanntlich nicht immer 
gleichgerichtet und - angesichts überlappender Wahlpe- 
rioden - nicht immer langfristig angelegt, geschweige denn 
durchgeführt. Oft werden gesetzlich verankerte wirt- 
schaftspolitische Maßnahmen binnen kurzer Frist wieder 
rückgängig gemacht respektive erheblich modifiziert.!) 
Schließlich scheitern oder verzögern sich wirtschafts- 
politische Maßnahmen aufgrund des Einspruchs von Inte- 


ressengruppen. 


Es ist daher nicht unplausibel anzunehmen, daß die Wirt- 
schaftssubjekte wirtschaftspolitischen Maßnahmen - selbst 
wenn sie hinreichend publik gemacht werden - nur in be- 
schränktem Umfang vertrauen. Angesichts der aufgeführten 
Imponderabilien wirtschaftspolitischer Entscheidungspro- 
zesse werden die Wirtschaftssubjekte ihre Erwartungen 
bezüglich künftiger Maßnahmen nur begrenzt revidieren, und 
zwar umso weniger, je weiter diese zeitlich entfernt 


sind.?) 


1) Beispiele aus der jüngeren Wirtschaftsgeschichte sind 
die Diskussionen um beschäftigungspolitische Maßnahmen 
während der SPD/FDP-Koalition bzw. um die Rückzahlbarkeit 
der Investitionshilfeabgabe in der CDU/CSU/FDP-Koalition. 
2) Abgesehen davon wirkt eine Abdiskontierung der 
zukünftigen Maßnahmen in dieselbe Richtung. 
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Die Stärke der Reaktionen der Wirtschaftssubjekte hängt 
überdies von dem jeweils untersuchten Markt ab: Finanz- 
märkte werden eher und heftiger auch auf kurzfristig 
konzipierte bzw. nur angekündigte Maßnahmen reagieren, im 
Gegensatz etwa zum Lohn- und Preisbildungsprozess, der im 
Mittelpunkt der in diesem Beitrag durchgeführten Analyse 
steht. Weiterhin ändern sich nur einige Parameter eines 
Makromodells aufgrund einer Politikänderung: einerseits 
gibt es eine Reihe von Verhaltensgleichungen, in denen Er- 
wartungen über künftige Politikreaktionen irrelevant sind, 
andererseits beeinflussen veränderte Erwartungen nicht 
notwendigerweise die Parameter des Modells, sondern z.T. 


nur den Wert der erwarteten Variablen. 


3. Beschreibung des ökonometrischen Modells 


Das der Untersuchung zugrundeliegende ökonometrische Mo- 
dell ist ein Partialmodell des Arbeitsmarktes, erweitert 
um eine Preisbestimmungsgleichung. Die Verbindung zum 
Gütermarkt der Volkswirtschaft erfolgt über den Aus- 
lastungsgrad des Produktionspotentials. Direkte Effekte 
des Geldmarktes auf das Arbeitsmarktgeschehen (z. B. über 
eine Faktorpreisrelation von Arbeit und Kapital in der 
Arbeitsnachfragefunktion) bleiben unberücksichtigt. Diese 
Einschränkungen und der hohe Aggregationsgrad des Modells, 
das keine Aussagen beispielsweise über intersektorale Ver- 
schiebungen in der Arbeitsnachfrage oder geschlechtsspe- 
zifische Änderungen des Arbeitsangebots enthält, legen 
eine vorsichtige Interpretation der Ergebnisse nahe und 
lassen den experimentellen Charakter der Studie deutlich 


hervortreten. 


Um die Übersicht über das Modell zu erleichtern, enthält 
Tabelle 1 eine Auflistung der endogenen und exogenen 
Variablen des Modells mit den dazugehörigen Symbolen. 
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Tabelle 1: Modellvariablen 


Endogene Varıable: DE 
ET Erwerbstätige insgesamt 
ET* ausländische Erwerbstätige inTausend | 
3% deutsche Erwerbstätige 
INES Zuwanderung italienischer Erwerbspersonen 

Zuwanderung ausländischer Erwerbspersonen 


Arbeitsangebot von Deutschen in Personen 


Symbol 


in Tausend 


in Tausend 


in Tausend 


L 
LEG 
D 


in Tausend 


Arbeitsangebot aus Nicht-EG-Ländern in 
Personen 


LNEG in Tausend 


Erwerbsquote der deutschen PET 
Erwerbsbevölkerung ( ALF = 1. Differenz von LF) GE 
Nachfrage nach Arbeit insgesamt in Personen 
Nachfrage nach ausländischen Arbeitskräften in 
Personen In Tausend 


Nachfrage nach deutschen Arbeitskräften in 
Personen In Tausend 
OUTES | Rückwanderung italienischer Erwerbspersonen 


Rückwanderung von Erwerbspersonen aus Nicht- 
1970 = 100 


PC Preisindex für Konsumgüter 


in Kaufkraft- 


Reallohndifferenz BRD-Italien 
standards 


аң 


m m 


Arbeitslose insgesamt in Personen in Tausend 
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Symbol Bezeichnung der Variablen 


UA ausländische Arbeitslose | in Tausend 


deutsche Arbeitslose in Tausend 


UR Arbeitslosenquote insgesamt inv. H. 


о 


UR? Arbeitslosenquote von Deutschen in v. H. 


URA Arbeitslosenquote von Ausländern in v. H. 
Offene Stellen in Tausend 


B Bruttostundenlohnsatz nominal 


Е 


WBS Bruttostundenlohnkosten nominal 
WNR Nettostundenlohnsatz real 
WPC Inflationsrate (Wachstumsrate von PC) 


In v. H. 


B Wachstumsrate WB In v. H. 


Exoqene Variable: 


| 


Arbeitslosenunterstutzungssatz (in v.H. des | 
АШ Nettolohnes) jeweils für BRD und Italien inv.H. 


AUS Auslastungsgrad des Produktionspotentials inv.H. 


Erwerbspersonen über 65 Jahre in Tausend 


GPOP Bevölkerung zwischen 15 und 65 Jahre insgesamt | in Tausend 


Index zur Entwicklung der Privathaushalte 1970 =1 


gewichteter Preisindex des privaten Verbrauchs 


70 = 
BRD/Italien 1970 = 100 
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Saisonkomponenten 

Heimatländer transferiert wird 

gewichtete Arbeitslosenquote Griechenland, 8 
le Türkei in v. Н. 
Haushaltsvermögen, real 
Wachstumsrate Arbeitsproduktivität 
WAPRT | Trend von WAPR 


Abgabesatz zur Sozialversicherung, Arbeitgeber | 
(jeweils für BRD und Italien) inv.H. 
Steuersatz plus Sozialversicherungsabgabesatz, f 
Arbeitnehmer (jeweils für BRD und Italien) in v. Н. 


Symbol 


1970 = 100 


URNES 


VHHR 


WAPR 
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Insgesamt enthält das Modell 29 endogene und 20 exogene 
variable, Il Die Schätzung erfolgte mit der zweistufigen Me- 
thode der kleinsten Quadrate. Als statistische Prüfmaße 
werden das Quadrat des um die Freiheitsgrade bereinigten 
multiplen OLS-Korrelationskoeffizienten?), die t-Werte (in 
Klammern unter den Regressionskoeffizienten) und die Dur- 
bin-Watson-Statistik DW respektive Durbins h (wenn die zu 
erklärende Variable zeitlich verzögert als erklärende Va- 
riable in der Gleichung auftritt) angegeben. Die Grund- 
zeitperiode des Modells sind Quartalswerte, der Beob- 
achtungszeitraum erstreckt sich von 1962/I bis 1979/IV, 


insgesamt liegen mithin 72 Beobachtungen vor. 


Schaubild 1: Struktur des Arbeitsmarktmodells 


Lohnsatz Arbeitsangebot 


Arbeitsnachfrage 


Arbeit 


l)Letztere ohne Saisonkomponenten in unterschiedlicher De- 
finition. 

2)Bei homogenen Regressionsgleichungen ist eine Berechnung 
von R? indessen nicht sinnvoll. 
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Schaubild 1 gibt eine stilisierte Darstellung der Struktur 
und Funktionsweise des Modells. Gleichgewicht auf dem Ar- 
beitsmarkt herrscht beim Lohnsatz wo. Der Lohnsatz ist im 
Modell indessen nicht voll flexibel, sondern wird über 
eine Verhaltensgleichung bestimmt, in der die Arbeits- 
marktsituation nur eine von mehreren erklärenden Variablen 
darstellt. Folglich gibt es Situationen, in denen beim 
Lohnsatz wi die Arbeitsanbieter in Höhe L2 rationiert sind, 
d.h. es herrscht Arbeitslosigkeit Lj-L2, während beim Lohn- 
satz w2 die Arbeitsnachfrage bei 12 rationiert ist und 
offene Stellen in Höhe von 21-12 vorhanden sind, II Frik- 
tionell und/oder strukturell bedingte Ungleichgewichte (z. 
B. aufgrund von Suchprozessen und Inkongruenz von ange- 
botenen und nachgefragten Berufen) führen dazu, daß beim 
Gleichgewichtslohn wo einer Zahl von Arbeitslosen in Höhe 
von Lo-L3 eine gleich große Menge von offenen Stellen 
gegenübersteht, während bei der mit wı verbundenen Arbeits- 
losigkeit Lj-La auch noch offene Stellen (wieder in Höhe 


von Lo-L3) vorhanden sind. 


Meßzahlen für die nicht beobachtete Variable "Arbeitsan- 
gebot" sind die Erwerbspersonen als Summe von Erwerbstäti- 
gen und der beim Arbeitsamt registrierten Arbeitslosen, 
während die "Arbeitsnachfrage” als Summe ebenfalls der 
Erwerbstätigen und der offenen Stellen - ungeachtet ihrer 
Meßproblematik - statistisch erfaßt wird. Daraus folgt, 
daß bei einer Schätzung von Arbeitsangebots- bzw. -nach- 
fragefunktionen entweder zusätzlich nur noch die Arbeits- 
losen oder nur die offenen Stellen durch eine Verhaltens- 
gleichung erfaßt werden müssen. Das vorliegende Modell 
wählt die erstgenannte Möglichkeit, um die Arbeitslo- 


sigkeit aufgrund ihrer wirtschaftspolitischen Relevanz 


1) Die Übereinstimmung der Strecken Lj-L2 dient nur der 
Übersichtlichkeit der Graphik. 
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möglichst exakt zu modellieren, während die offenen Stel- 
len als Residualgröße durch das Modell bestimmt werden, 
mit dem bekannten Nachteil, daß alle Schätzfehler in diese 
Größe eingehen. 

Ein Spezifikum des deutschen Arbeitsmarktes ist die hohe 
internationale Mobilität des Faktors Arbeit, die die in 
der Bundesrepublik Deutschland beschäftigten Ausländer von 
rd. 280 000 im Jahre 1960 auf etwa 2.6 Mio. im Jahre 1973 
ansteigen ließ. Der darauffolgende Rückgang auf etwa 1.9 
Mio. im Jahre 1979 ist teilweise auf den Anwerbestopp zu- 
rückzuführen. Damit wird bereits deutlich, daß die Höhe 
der Ausländerbeschäftigung nicht allein und direkt durch 
ökonomische Variablen bestimmt wird, sondern daß sie als 
eine arbeitsmarktpolitische Instrumentvariable angesehen 
werden muß. Dies gilt indessen nur einschränkend, da für 
Erwerbspersonen aus einem Mitgliedsland der EG im 
allgemeinen die Freizügigkeit der Arbeitsplatzwahl gilt. 
Neben der durch den Anwerbestopp ceteris paribus bewirkten 
Plafondierung der Ausländerbeschäftigung muß ebenfalls die 
Remigrationspolitik berücksichtigt werden, die sich auf- 
grund administrativer Maßnahmen durch beispielsweise einer 
Nichtverlängerung der Arbeits- respektive Aufenthaltser- 
laubnis ergibt. Allerdings hat die Remigrationspolitik 
insbesondere in der letzten Dekade stark an Bedeutung ein- 
gebüßt, da für die Ausländer vorteilhafte Regelungen be- 
züglich einer verlängerten Aufenthaltserlaubnis erlassen 
wurden und darüber hinaus Ausländer, die (temporär) in 
ihre Heimatländer zurückgekehrt wären, dies unterlassen 
haben, da der Anwerbestopp ihre Rückkehr nach Deutschland 


1) Insoweit ist es auch nicht mehr gerechtfer- 


verhindert. 
tigt, der Ausländerbeschäftigung eine Pufferfunktion zuzu- 


weisen. 


1) Siehe dazu Franz (1981). 
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Im folgenden werden die einzelnen Elemente des Modells 
kurz vorgestellt. Mit wenigen Ausnahmen stellen die 
Verhaltensgleichungen Standardversionen dar, so daß sich 


eine ausführliche Kommentierung erübrigt. 


Es erleichtert die Darstellung des Modells, wenn zunächst 
die Angebots- und dann die Nachfrageseite des Arbeits- 
marktes betrachtet wird. Das gesamte Arbeitsangebot (in 
Personen) setzt sich aus dem Arbeitsangebot der Deutschen 
(20), der EG-Ausländer (126) und der Nicht-EG-Ausländer 
(LEG) zusammen, wobei zu LEG die Italiener rechnen, da die 
nicht-italienischen EG-Erwerbspersonen quantitativ ver- 
nachlässigt und zu ІМЕС gezählt werden können. Im übrigen 
bilden die türkischen Erwerbspersonen den Hauptbestandteil 


von ІМЕС. 
(1) L, = L D + LEO + L МЕС 
t 
Um mit 17 zu beginnen, wird im Modell eine Verhal- 


tensgleichung für die Erwerbsquote LF der Deutschen im 
Alter zwischen 15 und 65 Jahren geschätzt (als erste Dif- 
ferenz). Die Erwerbsquote ist bereinigt um Änderungen in 
der Bevölkerung sowie deren Geschlechts- und Altersstruk- 
tur (GPOP) und der Haushaltsgröße (HH).?) 


(2) LP = LF,-HH,-GPOP, + EP65, 
(3) ALF, = -0.0142 AWNR, - 0.0047 AVHHR,., - 0.0047 AUR; 
(4.2) (9.1) (3.0) 
- 0.0051 (Q1-Q4) + 0.0034 (Q2-Q4) - 0.0008 (Q3-Q4) 
(3.9) (7.1) (0.8) 


DW = 1.9442 


1) Zur Vorgehensweise dieser Korrektur siehe Lucas und 
Rapping (1970, S. 279 £.). LF ist demnach definiert als LF 
= (1° - EP65)/(HH-GPOP). 
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Die Interpretation dieser Arbeitsangebotsfunktion ist 
hinlänglich bekannt: das negative Vorzeichen des Netto- 
reallohns (WNR)1) zeigt, daß der Einkommens- den Substitu- 
tionseffekt dominiert; aufgrund des Einkommenseffektes muß 
natürlich das reale Haushaltsvermögen (VHHR) ebenfalls 
einen negativen Einfluß auf das Arbeitsangebot haben. 
Schließlich erweist sich aufgrund des negativen Vorzei- 
chens der Arbeitslosenquote (UR), daß der "discouraged 
worker"-Effekt höher ist als der "additional worker"- 
Effekt. 


Definitorisch ergibt sich die Veränderung des Arbeits- 
angebots der Ausländer aufgrund von Zuwanderungen (IN) und 
Abwanderungen (OUT): 


(4) EPO 0 + INEC OUT EG 
(5) KE = ENG £ iN ee o TER 


Die Wanderungsströme der EG-Ausländer können mit den üb- 
lichen Migrationsmodellen erklärt werden.?) Neben der Real- 
lohndifferenz gemessen іп Kaufkraftstandards zwischen 
Deutschland und Italien (RD) und der Nachfrage nach Ar- 
beitskräften in Deutschland 3) - repräsentiert durch den 
Kapazitätsauslastungsgrad (AUS) - gehört auch der Bestand 
an italienischen Erwerbspersonen der Vorperiode zu den er- 
klärenden Variablen. Bei den Zuwanderungen INEC reflektiert 
diese Variable die Überlegung, daß in Italien nur ein 


bestimmtes Reservoir an "wanderungswilligen" Personen 


l) Definiert als WNR = WB(l-u)/PC, wobei WB der Brutto- 
nominallohnsatz, PC der Preisindex des privaten Verbrauchs 
und u der Abgabesatz der Arbeitnehmer sind. 

2) Siehe zum Folgenden auch Franz (1981), Franz und Kempf 
(1983). 

3) Die Arbeitslosenquote in Italien erwies sich bei der 
zweistufigen Schätzung als insignifikant. 


97 


vorhanden ist, das mit höherem L°¢,_, in größerem Umfang 
ausgeschöpft ist, so daß ІМС kleiner wird. 


(6) In EG = -84.0060 + 84.2125 RD, + 1.2593 AUS, , 
(4.9) (8.5) (6.1) 
-0.1145 LEG | + 1.8531 QIT, + 2.0151 Q2T, 
(5.4) (8.1) (13.7) 
+ 1.3246 Q3T, + 0.3336 QAT, 
18.6) (1.7) 
R? = 0.8520 
DW = 1.8424 


QIT für 19621 - 196611 
mit QIT = ‚I=1,.,4 
QI für 196611 - 19791V 


(7) OUT ЁС = 48.4961 - 78.5748 RD, + 0.1788 LFC , -1.0044 Т 
(2.9) (38) (5.2) (6.3) 
- 3.6130 QITT - 4.7014 Q2TT - 2.5315 Q3TT 
(2.6) (3.6) (1.9) 
+ 5.5867 Q4TT 
(3.8) 
R? = 0.8252 
DW = 1.7224 


mit QITT = [(QUT)-100}], I=1...., 
(1 —u)WB 


(8) Gët | PCT 


1 СЕ) + UR-ALUN 8° 


z (1-UR) + UR-ALU] Italıen 


Е —u)WB 
8 PC 


Die zeitabhängigen Saisonvariablen sollen die im Zeitab- 
lauf geringer werdende saisonale Bewegung in den Wande- 
rungsströmen erfassen, während der Zeittrend in der Ver- 


haltensgleichung für die Abwanderung die zunehmende Ten- 


98 


denz zum Verbleib in der Bundesrepublik Deutschland wider- 
spiegeln soll. 


Die Reallohndifferenz setzt sich aus den für die Bundes- 
republik respektive Italien relevanten Einkommensgrößen 
zusammen. Diese Komponenten sind die gewichteten Summen 
aus Nettoreallohn und Arbeitslosenunterstützung, wobei die 
Arbeitslosenquote als Gewicht fungiert, um die Wahrschein- 
lichkeit der jeweiligen Einkommenserzielung zu approximie- 
ren. Darüberhinaus unterscheiden sich die Einkommenskompo- 
nenten durch ihre Deflationierung: für das in Italien (von 
den migrationswilligen Italienern) zu erzielende Einkommen 
dient das italienische Konsumgüterpreisniveau (pcitalien) 
als Deflator, während für das in der Bundesrepublik zu er- 
wartende Einkommen der deutsche Preisindex des privaten 
Verbrauchs (PC???) nur insoweit relevant ist, als dieses 
Einkommen nicht nach Italien transferiert und dort konsu- 
miert wird. Vereinfachend und aufgrund fehlender Zeitrei- 
hen haben wir diesen Anteil mit Hilfe der Überweisungs- 
quote der Gastarbeitereinkommen in ihre Heimatländer (TR) 


berechnet. 


Während das Arbeitsangebot von Personen aus EG-Staaten 
keinen direkten staatlichen Regelungen unterworfen ist, 
trifft dies für Arbeitskräfte aus Nicht-EG-Staaten nicht 
zu. Dies gilt insbesondere für den Ende 1973 verfügten und 
noch heute (d. h. Mitte 1984) gültigen Anwerbestopp, der 
jedoch insoweit nicht vollständig ist, als Familienange- 
hörige von in der Bundesrepublik lebenden Gastarbeitern 
weiterhin einwandern und Arbeit anbieten können. Sowohl 
für die Zeitperiode des Anwerbestopps (ab 1973IV) als auch 
für die davorliegende Zeitperiode eines freieren Arbeits- 
marktzutritts auch für Nicht-EG-Angehörige haben wir 
staatliche Reaktionsfunktionen geschätzt. Dabei wurde 
unterstellt, daß der Staat in der Periode 19621-1973ll den 
Nachfrageüberschuß nach Arbeit in Deutschland durch Ein- 
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wanderung von Erwerbspersonen aus Nicht-EG-Staaten ver- 


ringert hat: 
(9) INNEG = a, +a AUS +a, URNEG für19621 - 1973. 


Der Kapazitätsauslastungsgrad soll dabei den Nachfragesog, 


die Nicht-EG-Arbeitslosenquote!?) 


den Angebotsdruck reprä- 
sentieren. Für die Zeit des Anwerbestopps ist die Fami- 
lienzusammenführung - verstärkt aufgrund der Arbeitsmarkt- 
bedingungen in den Nicht-EG-Staaten - bestimmend für die 
Zuwanderung: 


(9a) INNEG = a, +a, URNEG + а, LNEC fürl9731V - 19791У 


= 
Dem mit der Abwicklung der Zuwanderung in die Bundes- 
republik einhergehenden Zeitbedarf haben wir -~ verein- 
fachend für die gesamte Zeitperiode - mit einem Anpas- 


sungsmodell des Typs 
( 9b) IN ee _ INNES: = À EN ee _ БО] 
Rechnung getragen INNEG(*) bezeichnet die gemäß (9) und (9a) 


gewünschte Zuwanderung, so daß sich schließlich folgende 


Schätzgleichung ergibt: 


l)Gewichtete Summe aus den Arbeitslosenquoten Grie- 
chenlands, Jugoslawiens und der Türkei. 
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(10) IN NEG = - 208.3890 + 1.8949 AUS, (1-SSTO) 
(4.7) (4.4) 
+8.8116 UR “С + 0.0703 LNE |, (1-SSTO) 
(5.0) (3.7) 
+0.6983 INNEG + 5.4124 QI + 25.5669 Q2 
(12.6) (1.3) (7.7) 
+ 30.0064 Q3 
(8,4) 
R? = 0.9215 
DW = 1.8976 
h = 0.4923 


1 für 19731V - 19791У 
mit SSTO = 


0 sonst 


Bei der modellmäßigen Erfassung der Remigration der Nicht- 
EG-Arbeitskräfte gehen wir davon aus, daß diese zum über- 
wiegenden Teil nicht dauerhaft in der Bundesrepublik blei- 
ben wollen. Der Zeitpunkt der Rückwanderung wird durch die 
Arbeitsmarktsituation in der Bundesrepublik und in den 
Heimatländern und dem vorhandenen Bestand an Nicht-EG-Er- 
werbspersonen in der Bundesrepublik maßgeblich beeinflußt. 
Zusätzlich wird in der Schätzgleichung der bereits er- 
wähnte negative Effekt des Anwerbestopps auf die Remigra- 
tion untersucht. Im einzelnen ergibt sich aus einer Spezi- 


fikation der Gleichung für die Abwanderung des Typs 


(11) OUT HP =b -b UR YFC + b,UR, + (b,+b,-SSTO)-LNES, 
für eine freiwillige und arbeitsmarktinduzierte Remigra- 
tion (d. h. für SSTO = 0) der Ausdruck: - Ьуџв,МЕС + ЬЕ, 
+ Р während die Wirkung des Anwerbestopps auf die 
Remigration durch Ta beschrieben wird. Das Vorzeichen 
des Koeffizienten b, ist unbestimmt: es hängt davon ab, in- 
wieweit eine erfolgreiche Remigrationspolitik (d. h. 


b,>O)kompensiert wird durch ein zeitliches Hinausschieben 
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einer (temporären) freiwilligen Remigration anderer Nicht- 
EG-Gastarbeiter (d. h. b;<0), denen aufgrund eben dieses 
Anwerbestopps eine geplante Rückkehr nach Deutschland ver- 
wehrt wird. Unter Berücksichtigung einer zeitlichen An- 


passungsverzögerung ergab die Schätzung von (11): 


(12) OUT NEG = 60.9249 - 6.9844 URN® „| + 10.3559 UR, 
(4.0) (2.5) (23) 
+ (0.0226 - 0.0011 SSTO) LNEG ,, 
(3.5) (2.9) 
+ 0.2509 OUTNEG | 
(2.3) 
- 27.9297 91 - 11.3811 92 - 4.5687 Q3 
(3.8) (1.6) (1.0) 
R? = 0.5100 
DW = 2.0061 
h = -0.0675 


Es ist erkennbar, daß die Auswanderung wegen b,<0 bei einem 
Anwerbestopp ceteris paribus abnimmt, so daß die Wirksam- 
keit dieser Art der staatlichen Regulierung der Einwande- 
rung durch eine reduzierte Auswanderung zum Teil unterlau- 


fen wird. 


Die gesamte Nachfrage nach Arbeit N, unterteilt sich in die 
Nachfrage nach deutschen und nach ausländischen Arbeits- 
kräften (м2 bzw. pijen Die Arbeitsnachfrage ihrerseits be- 
steht aus realisierter Arbeitsnachfrage - den Erwerbstäti- 
gen (ET) - und den offenen Stellen (V) als der (noch) nicht 


realisierten Arbeitsnachfrage. 


1) Auf eine Definition der Arbeitsnachfrage in Arbeits- 
stunden insgesamt und eine separate Spezifikation der je 
Erwerbstätigen geleisteten Arbeitstunden (pro Zeiteinheit) 
wird aus Vereinfachungsgründen abgesehen. Siehe dazu Franz 
(1978a). 
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(13) = м0 + N, 
(14) N, = ET, + V, 


Zeitreihen über offene Stellen für Deutsche respektive 
Ausländer sind nicht erhältlich. Da eine offene Stelle in 
der Regel nur dann mit einem Nicht-EG-Ausländer besetzt 
werden kann, wenn kein deutscher Bewerber zur Verfügung 
steht, haben wir die offenen Stellen vereinfachend nur als 
nicht realisierte Arbeitsnachfrage für deutsche Arbeits- 
kräfte behandelt. 


(15) Ne SET? ФУ, 
(16) МЕТ 
Als Verhaltensgleichung für die Arbeitsnachfrage nach 


deutschen Arbeitskräften erhielten vir (bei bekannter Meß- 


problematik der offenen Stellen):?) 


(17) In NP = 0.5508 + 0.0748 In AUS, - 0.0363 In(WBS:PBWU), 
(3.1) (3.9) 4.0) 
+ 0.0041 In(PMG!PBWU), +0.7520 1п МО, 
10.7: 12.7) 
+ 0.0015 QI + 0.01325 Q2 + 0.0145 Q3 
10.8) (11.4) (10.0) 
R? = 0.9877 
DW = 1.5062 
h = 2.3329 


l)Wobei N? in (17) durch 1000 und PBWU durch 100 dividiert 
wurde . 
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Eine relative Zunahme des Auslastungsgrades um 1 Prozent 
führt bei gegebenem Bestand an Sachkapazitäten langfristig 
zu einer Erhöhung der Arbeitsnachfrage um 0.3 %, d. h. 
wenn der Kapazitätsauslastungsgrad beispielsweise von 80 
auf 85 % steigt, bedeutet das langfristig eine Mehrnach- 
frage nach Arbeit um etwa 400 000 Personen. Es ist natür- 
lich von vornherein klar, daß mit dem Kapazitätsaus- 
lastungsgrad in erster Linie konjunkturelle Schwankungen 
der Arbeitsnachfrage und weniger langfristige Trends be- 
schrieben werden. Da in dieser Studie hauptsächlich die 
Effekte einer konjunkturellen Stabilisierungspolitik un- 
tersucht werden sollen, haben wir uns für die Spezi- 
fikation der Arbeitsnachfragefunktion (17) entschieden und 
dabei die Vernachlässigung anderer wichtiger Aspekte in 
Kauf genommen. In bezug auf die realen Bruttolohnkosten 1) 
errechnet sich aus (17) eine langfristige Elastizität von 
-0.14, d.h. ein Anstieg dieser Variablen um 10 % hätte 
ceteris paribus langfristig einen Rückgang der Arbeits- 


nachfrage um ca. 300 000 Personen zur Folge. 


Zur Ermittlung der tatsächlichen Beschäftigung, d. h. der 
Erwerbstätigen, müssen entweder von den Angebotsvariablen 
LD, LEG und ІМС die entsprechenden Arbeitslosen UP, UFC und 
UNEG subtrahiert werden oder es muß noch zusätzlich eine 
Nachfrage nach ausländischen Arbeitskräften NET und NEG 
bestimmt und von N? die offenen Stellen subtrahiert werden. 
Wie bereits ausgeführt, haben wir uns für die erste Mög- 


lichkeit entschieden. Zu diesem Zweck werden im Modell je 


l) Diese berechnen sich als WBS= WB(l+rs), wobei WB der 
Bruttonominallohnsatz und s der Arbeitgeberbeitragssatz zur 
Sozialversicherung sind. 
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eine Arbeitslosenquote für deutsche und ausländische Er- 
werbspersonen geschätzt (UR? bzw. URÄ). Die Zahl der Ar- 
beitslosen in Personen erhält man dann sofort über die 


Definitionsgleichungen: 


(18) U Ee E 
(19) g= 2 Ge re poe = CRAL S + T 
(20) U =UP ete 


Mit Hilfe dieser Definitionsgleichunqen können dann die 


restlichen Größen wie folgt bestimmt werden: 


(21) deat Oremus fd 
(22) ЕТ ce E E 
(23) ЕТ, = ЕТО + ETA, 


so daß sich die Residualgröße, offene Stellen (V,), unter 
zusätzlicher Berücksichtigung der Definitionen (21) sowie 
(13) - (16) ermitteln läßt als: 


(24) у= М0 + ЕТА. +U, 
womit dann alle Bestandsgrößen des Arbeitsmarktes bestimmt 
sind. 


Die Schätzgleichungen für die genannten Arbeitslosenquoten 
UR? und ОКА lauten: 
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(25) UR = 1.8493 - 0.0270 AUS, + 0.0974(WBS/PBWU), 
(26) (3.5) (5.1) 
+0.0044 (PMG/PBWU), + 1.2340 ОКО, 
(2.4) (10.7) 
-0.7657 ОКО, „ + 0.6439 ОКО, , -0.3238 ОКО, | 
(4.4) (3.7) (3.1) 
- 0.4784 QL - 0.7072 Q2 - 0.5455 Q3 
(4.5) (5.9) ER 
R? = 0.9860 
DW = 1.9291 
(26) UR ` = 2.2514 -0.0551 AUS, + 0.2493:WBSıPBWU), 
(14) (3.4) (5.7) 
+ 0.0130(PMGiPBWU), + 1.3872 URA , 
(3.0) (13.7) 
- 1.1979 URA , + 0.8971 ORT, , - 0.3906 URĊ | 
(7.8) (5.6) (4.0) 
- 0.3966 Q1 - 0.7193 Q2 - 0.4392 Q3 
12.1) (4.9) (2.9) 
R? = 0 9727 
DW =2.1208 


Beide Gleichungen stellen eine reduzierte Form aus Ar- 
beitsangebot und -nachfrage dar, wobei zur Vermeidung von 
starken Multikollinearitäten jedoch nicht alle erklärenden 
Variablen jeder Gleichung berücksichtigt werden können. Im 
Hinblick auf den in diesem Beitrag zu untersuchenden 
Zusammenhang zwischen Arbeitslosigkeit und Inflation ist 
trotz dieser durch die reduzierte Form bereits erklärten 
Arbeitslosigkeit der verbleibende Teil des Arbeits- 
marktmodells nicht irrelevant, da z.B. in der noch zu be- 
handelnden Lohngleichung die Arbeitsmarktsituation durch 
eine Variable (V-U)/ET beschrieben wird, so daß eine Er- 


klärung von V und ET durch das Modell erforderlich ist. 
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Ein Vergleich zwischen der Bedeutung der einzelnen Ein- 
fluBfaktoren auf die Arbeitslosenquote der Deutschen re- 
spektive der Ausländer erlaubt folgende Übersicht über die 
Elastizitäten: 


Tabelle 2: Elastizitäten in bezug auf die Arbeits- 


losenquote 


kurzfristig langfristig 


Auslastungsgrad ТИЕТ ЕТИ 


reale Lohnkosten 0,4 
Verhaltnis: Preisindex 
0,2 


importierter 
Sowohl kurz- als auch langfristig haben ausländische Ar- 


erklärende 
Variable 


Vorprodukte zu 
Preisindex 
Bruttowertschöpfung 


beitskräfte bei konjunkturellen Schwankungen - respräsen- 
tiert durch den Auslastungsgrad - höhere Beschäftigungs- 
risiken als Deutsche. Zudem reagiert die Ausländerbeschäf- 


tigung stärker auf (Faktor-)Preiserhöhungen. 


Die letzten beiden Strukturgleichungen betreffen die Lohn- 
und Preisbestimmung, die im wesentlichen auf den aus der 
Literatur zur Phillipskurve bekannten Funktionen aufbauen 
und daher eine ausführliche Kommentierung überflüssig er- 
scheinen . lassen.!! Wesentliche Bestimmungsfaktoren der 
Lohnwachstumsrate (wwB) sind die Inflationsrate der Konsum- 
güterpreise (WPC), die Wachstumsrate der Arbeitsproduk- 
tıvität (WAPR) sowie der bereits erwähnte Indikator für die 


1) Siehe Franz (1978b, 1983a, 1983b). 
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Arbeitsmarktsituation (V-U)/ET. 


(27) WWB, = - 0.0202 + 0.5740 WPC, , + 0.7383 МАРЕК, 
(1.7) (3.7) (4.9) 
+ 0.2639 (У-0ЕТ, | + 0.5741 WWB, , 
(2.9) (6.6) 
R? = 0.7021 
DW = 2.0199 
h = 0.1244 
(28) WPC, = 0.0133 + 0.0708 WWBS + 0.0096 WPMG, 
(1.6) 13.7) (1.8) 
- 0.2660 WAPRT, + 0.8226 WPC, , 
SEN (17.6) 
R? = 0.9220 
DW = 1.9188 
h =0.3752 


Die Inflationsrate der Konsumgüterpreise wird von der 
Wachstumsrate der Bruttolohnkosten, der Inflationsrate für 
importierte Vorprodukte und vom Wachstumstrend der Ar- 
beitsproduktivität bestimmt. Die Begründung für dıe letzt- 
genannte Variable ist, daß Unternehmen z.B. aufgrund kon- 
trakttheoretischer Überlegungen zwar nicht jede Produkti- 
vitdtsverdnderung zum Anlaß für Preisrevisionen nehmen, 
den Trend dieser Entwicklung hingegen nicht unberücksich- 
tigt lassen. 


Einen langfristigen Zusammenhang zwischen Inflation und 
Arbeitslosigkeit erhält man durch Einsetzen der lang- 
fristigen Lösung von (27) in die von (28) und unter der 
zusätzlichen, sicherlich restriktiven Annahme, daß 
WWB = WWBS und WAPR = WAPRT: 


(29) WPC = 0.12 -1.8 МАРКЕ + 0.5 (V-UNET + 0.1 WPMG. 
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Demnach führt eine um einen Prozentpunkt geringere Ar- 
beitslosenquote U/ET bei Konstanz der offenen Stellen zu 
einem Inflationsanstieg um 0.5 Prozentpunkte. Im Vergleich 
zu einer neueren Phillipskurvenschätzung für den Zeitraum 
19651 - 19811У ist dieser Effekt nur etwa halb so groß wie 
in jener Studie.!) Auch der Einfluß des Produktivitätsfort- 
schritts ist dort höher ausgewiesen. Neben der Beobach- 
tungsperiode unterscheiden sich die Schätzungen jedoch 
auch durch die Einbeziehung weiterer Variablen, so daß ein 


Vergleich erschwert wird. 


4. Methodische Hinweise zum stochastischen Kontroll- 


ansatz 


In diesem Abschnitt soll ganz kurz auf die methodische 
Vorgehensweise und die damit verbundenen Probleme einge- 
gangen werden. Angesichts einer umfangreichen Literatur?) 
ist eine eingehendere Darstellung indessen nicht beabsich- 


tigt. 


Ausgangspunkt der Analyse ist bekanntlich ein ökonome- 
trisches Modell 


(30) у, = Ау, | + Cx, + d, ru, 
in dem y, einen Vektor der endogenen Variablen, d, einen 
Vektor der exogenen Variablen, x, einen Vektor von Kon- 
trollvariabllen, A und C Koeffizientenmatrizen und u, einen 
Vektor zeitlich unkorrelierter Redisiduen mit Erwartungs- 
wert O und Kovarıanzmatrix T bezeichnen. Das Modell (30) 


zerfällt in eine deterministische Komponente 


l)Sıehe Franz (1983b). 
2)2.B. Chow (1975, 1981), Friedman (1973), Stöppler 
(1979). 
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(31) y, = Аў, у + Cx, + d, , 


die man aufgrund von u, = 0 erhält, sowie einen sto- 
chastischen Teil 
(32) y = Ay" + Cx", + u, 

wobei y*, = у, Hr und x*, = x, - х,. Unterstellt sei weiter- 


hin ein quadratisches und in y, additives Kostenfunktional 


T T 
(33) _ `` - А < < er Ы 
ЕМ = 2 =a) KY,-a) +E ` y, K y, 


t=l t=1 


in dem a, die gewünschten Zielpfade der endogenen Variablen 
und K, die Gewichte, mit denen die Abweichungen der einzel- 
nen endogenen Variablen von ihren wirtschaftspolitisch ge- 


1) 


wünschten Werten bewertet werden, kennzeichnen. Dann be- 


steht das Problem darin, eine Politik 
(34) х= бу, 


zu finden, die das Kostenfunktional (33) unter der Neben- 
bedingung des OGkonometrischen Modells (30) minimiert. 
Dabei wird in zwei Schritten vorgegangen: zunächst wird 
der deterministische Teil des Kostenfunktionals unter der 
Nebenbedingung (31) im Hinblick auf Xe minimiert; dann 


folgt eine Minimierung des stochastischen Terms in (33) im 


1) Der aufgrund der Symmetrieeigenschaft von (33) mögliche 
Nachteil, daß positive und negative Abweichungen vom Soll- 
pfad gleichermaßen bestraft werden (z.B. bei Arbeits- 
losenquoten, Inflationsraten) läßt sich durch eine ehr- 
geizige Zielformulierung vermeiden, so daß die tat- 
sächlichen Werte z. В. immer oberhalb der Zielwerte 
liegen. Eine Alternative dazu wäre Friedmans (1973) 
stückweise, quadratische Kostenfunktion. 
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Hinblick auf x*, unter der Nebenbedingung (32). Die opti- 
male Politik besteht dann aus der Summe der Lösungen für x, 
und х*,. Die Lösungsalgorithmen basieren entweder auf 
Lagrange-Multiplikatoren oder - wie in diesem Beitrag - 


auf Bellmans Prinzip der dynamischen Programmierung. 


Die wesentlichen Unterschiede zwischen dem determi- 
nistischen und stochastischen Kontrollansatz liegen nicht 
in den Gleichungen des Problems, auf die die Störgrößen 
keinen Einfluß haben. Vielmehr sind die Zeitpfade für die 
optimalen Werte für x, und der mit ihnen verbundenen Werte 
ye-; Nunmehr stochastisch, mit der Folge, daß im Gegensatz 
zum deterministischen Modell (u, = 0) im Ausgangszeitpunkt 
die optimalen Werte für x, nicht mehr für alle künftigen 
Zeitperioden berechnet werden können, sondern jeder 
künftige optimale Wert von x, erst nach Kenntnis der ent- 
sprechenden stochastischen Variablen Ye-] bestimmt werden 
kann. Außerdem ist der aufgrund von (33) berechnete Wohl- 
fahrtsverlust im stochastischen Fall höher: zusätzlich zu 
den Kosten der Abweichung der deterministischen Variablen 
g. von ihrem Zielpfad a, entstehen Kosten der Abweichungen 
von у, von у, wobei die stochastische Komponente des Wohl- 
fahrtsverlustes durchaus größer sein kann als die deter- 


ministische. 


Die Konsequenzen fiir die Wirtschaftspolitik liegen auf der 
Hand: im Gegensatz zum deterministisch formulierten Tin- 
bergen-Theorem kann auch bei einer Gleichheit von wirt- 
schaftspolitischen Zielen und Instrumenten nicht erwartet 
werden, daß die stochastische Zeitreihe y, den wirtschafts- 


politischen Zielvorstellungen entspricht. 


Abgesehen von der Evaluierung optimaler wirtschafts- 
politischer Strategien kann die Kontrolltheorie auch die 
Auswirkung dieser Maßnahmen auf wirtschaftspolitische 
Zielkonflikte aufzeigen, z. B. auf den durch die Phillips- 
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kurve beschriebenen Zusammenhang zwischen Arbeitslosigkeit 
und Inflation. Da dieser "trade-off" vermutlich nicht 
invariant ist gegenüber alternativen wirtschaftspoli- 
tischen Maßnahmenbündeln, liegt es natürlich nahe, einen 
"optimalen trade-off" zu berechnen, der auf der Basis 
optimaler wirtschaftspolitischer Maßnahmen beruht. Die 
Vorgehensweise kann besonders einfach für den statischen 
und deterministischen Fall graphisch aufgezeigt werden. 
Das im vorhergehenden Abschnitt dargestellte ökono- 
metrische Modell liefert eine "langfristige" Phillipskurve 
[vgl. Gleichung (29)]: 


(35) WPC =a,-a,UR + a, Z. 


wobei WPC die Inflationsrate, UR die Arbeitslosenquote und 
Z ein Vektor der restlichen erklärenden Variablen (d.h. 
МАРВ, VET und WPMG) darstellen. Unterstellt sei weiterhin 


ein Kostenfunktional 
(36) W = k (WPC - МРС")? + k (UR - UR, 


wobei die mit * bezeichneten Größen die wirtschaftspo- 
litisch gewünschten Zielwerte von WPC und UR angeben. Wenn 
im einfachsten Fall К, = ky = 1 und ИРС* = UR* = 0 gesetzt 
werden, liegen die Isoverlustpunkte auf einem Kreis. Der 
Tangentialpunkt der Phillipskurve mit der am weitesten zum 
Ursprung des Koordinatensystems verschobenen Isoverlust- 
kurve gibt dann - falls er existiert - einen Punkt eines 
optimalen "trade-offs" zwischen Inflation und Arbeits- 
losigkeit an. Für andere Werte der Gewichte k, und k, er- 


hält man natürlich andere Isoverlustkurcven?). 


1)2.B. läßt eine Erhöhung von k, bei konstantem k, die Iso- 
verlustkurve die Gestalt einer Ellipse annehmen. Beiläufig 
sei darauf hingewiesen, daß das Optimierungsergebnis nicht 
von den absoluten, sondern nur von den relativen Werten 
der Gewichte abhängt. 
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Um nun die Frage beispielsweise nach der niedrigsten 
Inflationsrate bei einer tolerablen Arbeitslosenquote von 
UR* = 3.0 zu beantworten, setzt man für ку einen hohen, für 
ky einen niedrigen Wert an (also z. B. k, = 1000 und ky = 1) 
und für WPC* = 0 und UR* = 3.0.1) Minimierung der Verlustfunk- 
tion W = 1000 WPC? - (UR-3.0)? unter der Nebenbedingung der 
Phillipskurve liefert einen Wert der Arbeitslosenquote in 
der Nähe von 3 v. H. und die dazugehörige mimimale Infla- 
tionsrate. Ehrgeizigere Beschäftigungsziele (z.B UR* = 2.0) 
müssen dann mit einer höheren, jedoch minimalen Infla- 
tionsrate erkauft werden. Im dynamischen Kontext wird die 


Verlustfunktion 


T 
SES w= У |k (wec,—wec’? - k (UR – ОВ)? 
=1 


= 


unter der Nebenbedingung des dynamischen ökonometrischen 
Modells minimiert. In Wiederholung des obigen Beispiels 
wird der optimale Zeitpfad der Inflationsrate durch diesen 
Ansatz ermittelt, indem man z.B. k), = 1000, К, = 1, WPC,* = 0 
und UR,“ = 3.0 setzt. Weitere Zeitpfade für WPC, berechnen 
sich durch Vorgabe alternativer Werte für UR,*. Eine 
zusammenfassende graphische Darstellung dieser Zeitpfade 
erfolgt zweckmäßigerweise in einem Diagramm, in dem auf 
der Ordinate die RMS-Werte der Inflationsrate, auf der 


Abszisse die der Arbeitslosenquote abgetragen werden.?) 


1) Siehe Chow (1981, S. 115). 
2) Der RMS-Wert (RMS = root mean squared) einer Vari- 
ablen ist definiert als 


, T 
RMS(x) = | ` сут) mitx = Optimalpfad . 


Le Le 


t=1 
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5. Die Berechnung des "“trade-off's" zwischen _Infla- 
tionsrate und Arbeitslosenquote 


Das kontrolltheoretische Instrumentarium ermöglicht die 
Kalkulation eines potentiellen "trade-off's" zwischen In- 
flationsrate und Arbeitslosenquote unter Berücksichtigung 
des ökonometrischen Modells auf folgende Weise 1): 

1) Der Nominalpfad der Arbeitslosenquote (UR) wird in 
entsprechender Höhe vorgegeben, 

2) Vorgabe des Nominalpfades der Inflationsrate (WPC) 
in geringer Höhe, 

3) In der Verlustfunktion wird der Gewichtungsfaktor 
von UR sehr hoch und der von WPC minimal 
angesetzt, 

4) Variation der Nominalpfade von UR. 


Die Existenz eines "trade-off's" ist dann gegeben, wenn 
die RMS-Werte von UR sukzessive steigen und die von WPC suk- 
zessive fallen, d. h. daß die übliche Annahme, daß bei 
hoher Arbeitslosigkeit eine geringe Inflationsrate und 
vice versa existiert, bestätigt wird. Für den hier zu be- 
rechnenden "trade-off" wurde die Verlustfunktion wie folgt 


formuliert: 


ae) и = N (жс, РС) + Sr, (ÚR -UR } 

б=1 t=1 | 
mit Ку = 10 000, ky = 0.01, ИРС,* = 2%, UR,* = 1%, 2%, 3%, 4 x, 
5%, 6 % und 7 %, wobei die mit A gekennzeichneten Größen die 
sich ergebenden Optimalpfade sind. Die Kontrollvariablen 
AUS und PMG wurden nicht gewichtet, um die Berechnung des 
"trade-off's" nicht durch die historischen Pfade der Kon- 


trollvarıablen zu beeinflussen. 


1) Siehe Chow (1981, S. 115 ff). 
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Tabelle 3 zeigt die Vorgehensweise und die Ergebnisse zur 
Kalkulation des "trade-off's" unter Berücksichtigung des 


in Kapitel 3 beschriebenen 6konometrischen Modells. 


In Spalte 1 der Tabelle 3 sind die alternativen Nominal- 
pfade im Planungszeitraum für die Arbeitslosenquote (UR) 
angegeben. In einer Schrittweite von 1 %, ausgehend von 
einer einprozentigen Arbeitslosenquote, wurden sieben 
Läufe durchgeführt. Die Gewichtung der Arbeitslosenquote 
(Spalte 2) betrug für UR durchgehend 10000. Dieser hohe Ge- 
wichtungsfaktor garantiert die exakte Zielerreichung, daß 
heißt, die Abweichungen zwischen Optimalpfad und Nomi- 
nalpfad waren dadurch vernachlässigbar klein, was durch 
die RMS-Werte der Spalte 3 zum Ausdruck kommt. Der Nomi- 
nalpfad der Inflationsrate (WPC), dargestellt in Spalte 4, 
betrug in allen Läufen 2 %. Durch den niedrigen Gewich- 
tungsfaktor von 0.01 (Spalte 5) wurde die Inflationsrate 
zwar in der Verlustfunktion berücksichtigt, sie konnte 
sich, da Abweichungen vom Nominalpfad nur minimal bestraft 
wurden, jedoch frei entwickeln, wie die RMS-Werte der 
Spalte 6 zeigen. Ein Vergleich der Spalten 3 und 6, 
dargestellt im Schaubild 2 zeigt, daß sich ein linearer 
"trade-off" zwischen Arbeitslosenquote und Inflationsrate 
ergab. Zum Beispiel führt eine Senkung der Inflationsrate 
von 2.6 % auf 2.08 % zu einer Erhöhung der Arbeitslosenquote 
von 4 % auf 5 %. Die in der Tabelle 3 ausgewiesenen Kosten 
(Spalte 7 bis 9) für jeden Lauf, sind in die totalen 
Kosten (Spalte 7), in den deterministischen Anteil (Spalte 
8) und in den stochastischen Anteil (Spalte 9) aufgeteilt. 


Tabelle 3: Berechnung des trade-off zwischen Inflationsrate (WPC) und Arbeitslosenquote (UR) 


pfad ministisch | chastisch 


RMS” Nominal- RMS” total 
pfad 


з» oo [зо | 2% | 001 | os [2972342 | 34424 [937868_ 
з» [ oo | so | 2% | omn | 2000 5122520 | 41294 ]5083226_ 
en] o | so | 2% | oor | mass [5202558 [122607 [5182361 | 
[7% [| mao | o | 2% | oor [зз Sessea [222639 [5283786 | 


Nominal- deter- sto- 


4) RMS (root mean squared) ist berechnetals( > Ge eu 


l 


Tr 
, wobei i= Optimalpfad und T = Planungszettraum. 


t 


SLI 
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Schaubild 2: Trade-Off zwischen Arbeitslosigkeit und 


Inflatıon 


RMS (WPC) 


RMS (UR) 


Die Berechnung der Kosten folgt aus der quadratischen Ver- 


lustfunktion!) 


T 
(39 a) W=E У (у,-а K y, а) 
t=1 
(39 b) J И 
к =, Sen. М ae 
Wee a ENIKO — Dä К,0,-9,) 
б= 1 1 = 1 
T T 
(39 c) W= У spiKf)+ № @,-a)K,ö,-a,, 


t=1 t=1 


T 
wobei z sp (К,Г,) den stochastischen und > (y,-4,) K,G,-4,) 
t=1 


~ 
II 
= 


den deterministischen Kostenanteil bezeichnet. 


l) Siehe Chow (1981). 
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Г, ist die Varianz-Kovarianzmatrix, resultierend aus den 
Residuen des geschätzten ökonometrischen Modells. Im vor- 


liegenden Fall ist T, eine Diagonalmatrix mit den Elementen 


d. h. die Elemente der Hauptdiagonale von T, sind identisch 
mit den Standardfehlern der Regression jeder geschätzten 


Gleichung des ökonometrischen Modells. 


Der Vektor 9, ist die Lösung des deterministischen Teils 
der Differenzengleichung 1.Ordnung aus der reduzierten 
Form des Modells, d. h. für 


(40) у, = AY, + CE, + d. 


dann folgt als Lösung für §,, die finale Form !) 


(41) у, = Ау + CX, + ACZ p +... + АСТ +d, + Аа, | 
Fat Аба, 


Der Vektor a, sind die vorgegebenen Nominalpfade und K, die 


t 
Gewichtungsmatrix, die bei dieser Untersuchung jedoch 


zeitunabhängig ist. 


Spalte 7 der Tabelle 3 zeigt die Ergebnisse der Gesamt- 
kosten je Lauf, wobei sich bei einem Nominalpfad von 3% 
für die Arbeitslosenquote und 2 % für die Inflationsrate 
die "volkswirtschaftlich günstigste" Version ergab. Der 
deterministische Kostenanteil erreicht bei gegebenem WPC 
sein Minimum bei einer 4%igen Arbeitslosenquote, um dann 


sukzessive bis zum Maximalwert anzusteigen. Der durchweg 


1) Siehe Chow (1975, S. 106 ff). 
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extrem hohe stochastische Anteil an den Gesamtkosten 
zwischen 95 % und fast 100 % in Tabelle 4 verdeutlicht die 
Wichtigkeit der Berücksichtigung der Residualgrößen bei 
der Berechnung des "“trade-off's", а. h. die bei der 
Schätzung des ökonometrischen Modells auftretenden Resi- 
duen, resultierend aus einer potentiellen Fehlspe- 
zifikation des Modells, Fehlern in den Variablen oder 
einer falschen funktionalen Form einzelner Gleichungen, 


können kaum vernachlässigt werden. 


Tabelle 4: Nominalpfade und stochastischer Kostenanteil 


Nominalpfad stochastischer 
Kostenanteil 


an Gesamtkosten 


Eine rein deterministische Untersuchung verringert zwar 
die Kosten und damit einhergehend die Unsicherheit, kann 
aber durch die Vernachlässigung der stochastischen Kom- 
ponente zu falschen Ergebnissen und damit zu falschen 


wirtschaftspolitischen Aussagen führen. 
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Kontrolitheoretische Ansätze zur Bestimmung von Feedback- 
Regeln: Eine Sensitivitatsanalyse*? 


Harald Frommholz 
Jürgen Wolters 


1. Einleitunq 


Kontrolltheoretische Ansätze ermöglichen im Hinblick auf 
ein vorgegebenes Zielsystem eine optimale Steuerung dyna- 
mischer Systeme. Durch den Einsatz bestimmter Politiken 
(Instrumente) kann man die Zeitpfade ökonomischer Vari- 
ablen in eine gewünschte Richtung lenken. Grundlagen für 
die Anwendung der Kontrolltheorie sind ein ökonometrisches 
Modell, das die Quantifizierung der Wirkungszusammenhänge 
ökonomischer Prozesse liefert und eine Zielfunktion, die 
die wirtschaftspolitische Präferenzordnung sowie die ge- 
wünschten Zielpfade des Entscheidungsträgers repräsen- 
tiert. Die Bestimmung des "optimalen" Instrumentenein- 
satzes ergibt sich, wenn die vorgegebene Zielfunktion un- 
ter der Nebenbedingung des geschätzten Gkonometrischen Mo- 


dells optimiert wird. Ansätze dieser Art finden häufig An- 


*JUnseren Kollegen G. Flaig, W. Franz, W. Gaab, W. 
Höllenschmitt, T. Kempf, H. Kräger und K. Zimmermann sei 
an dieser Stelle für kritische Hinweise recht herzlich 
gedankt. 
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wendung zur Ableitung stabilisierungspolitischer Regeln.! 


Vollständige Stabilisierung oder Kontrollierbarkeit, d. h. 
die Optimalpfade für die Zielvariablen stimmen mit den 
entsprechenden vom Wirtschaftspolitiker gewünschten Werten 
überein, würde formal der Optimierung ohne Berücksichti- 
gung der durch das ökonometrische Modell gegebenen Re- 
striktionen entsprechen. Diese Restriktionen können aber 
eine vollkommene Anpassung verhindern. Im statischen li- 
nearen Modell, wie es von Tinbergen (1952) zur Bestimmung 
quantitativer wirtschaftspolitischer Aussagen benutzt wur- 
de, ist notwendig und hinreichend für die statische Kon- 
trollierbarkeit, daß die Anzahl der Ziel- und Instrument- 
variablen übereinstimmt, und daß die Instrumente aufgrund 
der Modellverknüpfungen linear unabhängig sind. Die dyna- 
mische Kontrollierbarkeit im linearen dynamischen Modell 
verlangt, daß Matrizen dynamischer Multiplikatoren gewisse 


lineare Unabhängigkeitsbedingungen erfüllen. 2) 


Bei diesen Kontrollierbarkeitsbedingungen wird unter- 
stellt, daß beliebig große Änderungen der Instrumentva- 
riablen zugelassen sind, die häufig in der Realität nicht 
durchführbar sind. Der kontrolltheoretische Ansatz kann 
durch eine entsprechende Ausgestaltung der Zielfunktionen 
einerseits die Intrumentvariationen auf zulässige Bereiche 
beschränken und andererseits eine gute Approximation an 
die gewünschten Zielpfade erreichen, auch wenn die Kon- 


trollierbarkeitsbedingungen nicht erfüllt sind. 


1)Siehe insbesondere den Literaturüberblick von Kendrick 
(1976), sowie die von Frohn (1980) und Gruber (1983) her- 
ausgegebenen Sammelbände, in denen sowohl methodische als 
auch anwendungsorientierte Probleme ökonometrischer Ent- 
scheidungsmodelle behandelt werden. 

2)Vgl. hierzu z. B. Preston und Sieper (1977). 
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Die so abgeleiteten Politiken werden daher von der unter- 
stellten Zielfunktion und dem zugrundeliegenden ökonome- 
trischen Modell beeinflußt. Die Anwendung eines solchen 
Verfahrens in der praktischen Wirtschaftspolitik ist aber 
umso erfolgreicher, je robuster die damit erzielten Ergeb- 
nisse gegenüber Fehlspezifikationen sind. Oder anders for- 
muliert, man muß abschätzen können, wie sensitiv die Re- 
sultate sowohl auf Veränderungen im ökonometrischen Modell 


als auch auf Veränderungen in der Zielfunktion reagieren. 


Wird die Sensitivität hinsichtlich des unterstellten Mo- 
dells analysiert, so können folgende Auswirkungen, die 
sich auf (i) fehlspezifizierte Gleichungen, (ii) Unsicher- 
heiten in den Strukturparametern, (iii) unsichere Modell- 
prognosen und (iv) die unbekannte zukünftige Entwicklung 
der nicht kontrollierbaren (exogenen) Variablen beziehen, 
untersucht werden. Ein erster Ansatz hinsichtlich der An- 
wendbarkeit kontrolltheoretischer Methoden bei fehlspezi- 
fizierten Modellen findet sich bei Chow (1977). Probleme 
der Unsicherheit in der Entwicklung der exogenen Variablen 
und deren AuSwirkungen auf die Optimalpfade analysieren 
Holly et. al. (1979). 


Sensitivitätsanalysen, die bei der Zielfunktion ansetzen, 
müssen die Abhängigkeiten der Optimalpfade von (i) den 
vorgegebenen Zielpfaden (Sollwerten), (11) dem Planungs- 
horizont und (iii) der Präferenzordnung des Wirtschafts- 
politikers, die sich in der Gewichtung der Abweichungen 
der Zielvariablen von ihren Sollwerten widerspiegeln, auf- 
zeigen. Ein iterativer Ansatz zur Ermittlung der Gewichte 
bei bekannter Zielfunktion bzw. bei vorgegebenen Zielpfa- 


den wird in Rüstem et. al. (1979) vorgeschlagen. 
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Für das linear-quadratische Optimierungsproblem, d. h. 
eine quadratische Kostenfunktion wird unter der Neben- 
bedingung eines linearen Modells minimiert, hat Hughes- 
Hallett (1979) analytisch die Auswirkungen auf die Op- 
timalpfade aufgrund von Änderungen in den stochastischen 
Schocks, in den Modellparametern und in den Gewichten der 
Zielfunktion abgeleitet. Allerdings lassen sich hieraus 
keine generellen Ergebnisse sofort erkennen, so daß auch 
eine empirische Sensitivitätsanalyse hinsichtlich der 
Struktur des Modells und der Präferenzordnung durchgeführt 
wird. Es zeigt sich, daß für das Modell Klein 1, das der 
Analyse zugrunde liegt, die Optimalpfade wesentlich sensi- 
tiver gegenüber Änderungen in den Strukturparametern und 
Residuen reagieren als gegenüber vergleichbaren Änderungen 
in den Gewichten der Zielfunktion. Analytische Aussagen 
hinsichtlich der Auswirkungen von Änderungen der Zielpfade 
leitet Sandbloom (1979) ftir zwei einfache Fälle ab: (i) 
Werden alle Zielpfade im gleichen Verhältnis variiert, 
impliziert dies eine Änderung der Optimalpfade im gleichen 
Verhältnis. (ii) Werden die Zielpfade dagegen in unter- 
schiedlichen Proportionen geändert, so reagieren die 
Optimalpfade mit den jeweiligen entsprechenden Verdn- 
derungen. Baum (1980) zeigt, wie sensitiv die Optimalpfade 
auf Veränderungen der Zielpfade und der Prognosewerte der 
exogenen Variablen reagieren. Weitere analytische Ergeb- 
nisse hinsichtlich der Abhängigkeit der Zielfunktionen und 
der Optimalpfade von den Gewichtungen und den Zielpfaden 
in einer beliebigen Periode finden sich in Kuhbier (1980, 
1981) für das deterministische linear-quadratische Kon- 
trollproblem. Die Auswirkungen alternativer Zielsysteme 
auf der Basis einer Version des Modells von Uebe für die 
Bundesrepublik Deutschland untersuchen Stöppler und 


Deissenberg (1977) empirisch. 
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Da das Problem der Robustheit kontrolltheoretisch abge- 
leiteter Politikregeln insbesondere für den Anwendungsfall 
von größter Wichtigkeit ist, wollen wir im folgenden eine 
detaillierte Sensitivitätsanalyse bezüglich Veränderungen 
in der Zielfunktion durchführen.!! Es sollen dabei im 
einzelnen die Auswirkungen unterschiedlicher Planungshori- 
zonte, unterschiedlicher Zielpfade, unterschiedlicher Ge- 
wichtungen sowie der Einsatz unterschiedlich vieler 
Instrumente auf die Optimalpfade ausgewählter Ziel- 
variablen analysiert werden. Da der Einfluß der 
Zielfunktion isoliert behandelt werden soll, wird als fest 
vorgegebener Entscheidungsrahmen der deterministische Teil 
des Modells von Frowen und Arestis (1976) für die 
Bundesrepublik Deutschland zugrundegelegt. Da es sich hier 
im wesentlichen um eine methodische Arbeit handelt, wurde 
ein relativ einfaches lineares Modell ausgewählt, um bei 
der Vielzahl von durchgeführten Experimenten die Rechen- 
zeiten in Grenzen zu halten. Die Autoren selbst benutzen 
ihr Modell dazu, um auf der Basis dynamischer Multi- 
plikatoren Aussagen über die relative Wirksamkeit von 
Geld- und Fiskalpolitik abzuleiten. Es scheint allerdings 
sinnvoller zu sein, solche Überlegungen im Rahmen einer 
kontrolltheoretischen Untersuchung durchzuführen, da hier 
explizit eine Wohlfahrts- oder Kostenfunktion als Beur- 


2) 


teilungsgrundlage enthalten ist. Die folgenden Resultate 


l)Auch wenn eine Reihe analytischer Ergebnisse 
hinsichtlich der Abhängigkeit der Optimalpfade von 
Parametern der Zielfunktion abgeleitet wurden, sind die 
vorliegenden Formeln i. a. so komplex, daß sie nicht all- 
gemein interpretiert werden können, sondern auch für 
vorgegebene numerische Werte ausgewertet werden müssen. 


2)Auf dem Modell von Frowen und Arestis (1976) basiert 
auch die von Frommholz und Wolters (1983) durchgeführte 
Untersuchung der relativen Effizienz von Geld- und Fiskal- 
politik, wobei die dynamischen stochastischen Eigenschaf- 
ten des geregelten Modells im Frequenzbereich im Vorder- 
grund der Analyse standen. 
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basieren auf einer quadratischen Verlustfunktion.!! 


Zunächst wird kurz der Algorithmus zur Lösung des linear- 
quadratischen Optimierungsproblems für den deterministi- 
schen Fall dargestellt. Daran schließt sich eine Beschrei- 
bung des dkonometrischen Modells an. Danach werden in 
sechs verschiedenen Experimenten Sensitivitätsanalysen 
hinsichtlich des Planungshorizontes, hinsichtlich der 
Sollpfade, hinsichtlich der Gewichtungen und hinsichtlich 


der Anzahl der eingesetzten Instrumente durchgeführt. 


2. Der Kontrollalgorithmus zur Lösung des _ linear-qua- 
dratischen deterministischen Entscheidungsproblems 


In diesem Abschnitt formulieren wir kurz den Kontroll- 
algorithmus von Chow (1975), der hier zur Ermittlung einer 
optimalen Entscheidung verwendet wird. Wir beschränken uns 
auf die Darstellung eines Entscheidungsmodells mit deter- 
ministischem?), linearem Zustandssystem und quadratischer 
Zielfunktion sowie einem endlichen Planungszeitraum, der 
aus T diskreten Perioden besteht, wobei T der Planungshori- 


zont ist. 


Als Instrumentvarıablen Ur (Entscheidungsvariablen) be- 
zeichnen wir die vorherbestimmten Variablen, die der Ent- 
scheidungsträger zur Steuerung der endogenen Variablen Ye 


einsetzen kann. Die exogenen Variablen z,, die nicht im 


1) Auf die Probleme und möglichen Modifikationen quadra- 
tischer Zielfunktionen soll hier nicht näher eingegangen 
werden. Man kann diesen Ansatz als eine Taylorreihen- 
approximation zweiter Ordnung für die wahre nichtlineare 
Zielfunktion ansehen. 


2)Die Berücksichtigung stochastischer Elemente impliziert 
in der Regel alternative optimale Politiken. Vgl. hierzu 
den Artikel von Frommholz (1984) in diesem Band. 
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Einflußbereich der Entscheidungsinstanz liegen, werden 
außerhalb des Modells bestimmt. Es wird unterstellt, daß 
ihre Werte für den Optimierungsvorgang in jeder Periode 


bekannt sind. 


Die Zustandsform des dynamischen, linearen Modells kann 
immer (durch Einführung von Hilfsvarialen) als Differen- 
zengleichungssystem 1. Ordnung dargestellt werden. In der 


reduzierten Form erhalten wir für den Zustandsvektor Y: 
(1) Y = АҮ + Bu, + C2, t= 1....,T. 


In dieser Konstruktion enthält der Zustandsvektor Y, neben 
den Hilfsvariablen, um die verzögerten endogenen Variablen 
mit einem lag größer als eins zu erfassen, auch den Vektor 
u, und dessen verzögerte Werte. Es sei Y, ein n-dimen- 
Sionaler Spaltenvektor, ue ein r-Vektor und z, ein s-Vektor. 
A 


в, und C, seien zeitvariable Matrizen entsprechender 


tf "Ze 
Dimension, deren Elemente bekannt sind. Der Anfangszustand 
ү sei vorgegeben. Als Zielfunktion wählen wir hier die 
quadratische Verlustfunktion, die die Summe aller quad- 
rierten Abweichungen zwischen den Elementen des Zustands- 
vektors Y, und den jeweils entsprechenden vorgegebenen 


Sollwerten а, minimiert: 


2 x 
(2) W= Ka (Y =a, K,(Y,—a,) Min. 


Die Elemente von K, nennen wir Gewichte (Gewichtungsma- 
trix), sie können. auch als. Kostenfaktoren interpretiert 
werden. K, sei eine zeitabhängige, positiv semidefinite 
Diagonalmatrix (diese Annahme ist wichtig für ein ein- 
deutiges Optimum). Häufiger Kritikpunkt an der Verlust- 
funktion ist ihre Symmetrieeigenschaft, d. h. positive und 


negative Abweichungen vom Sollwert werden gleich bewer- 
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tet!), außerdem werden größere Abweichungen überpropor- 
tional bestraft. 
Um das Optimierungsproblem 


T 
— 1 
(3) w= Š (Y -a) K (Y —a )— Min. 
= 2 t £ t t t 
t=1 
Lë = A, Em + Bu, + C z, t= 1,... T. Y gegeben, 


zu lósen, soll hier der Lagrange-Ansatz angewandt werden. 
Die Lagranqefunktion lautet: 


| Г. T 

- N (Y -aFK(Y-a)- УА (Үү -AY 
2 — t t t t t a, t t t- 
t=1 t= 


(4) L(Y ,us AM) = i 


wobei die Lagrangemultiplikatoren in einem n-dimensionalen 
Spaltenvektor \, zusammengefaßt sind. Differentiation der 
Lagrangefunktion nach den Variablen Y, u für t = 1,...,T 


und Nullsetzen der Ableitungen führt auf 


(5) A , _ _ | _ 
ЗҮ =K (Y тале, ат = 0, ES least: Nag = 0, 
t 
ab 
(6) — = ВА =0, eren 
du t t 
t 
oL 
(7) Sg = -(Ү,-АҮ „Bu E E t= 1,..., T. 
t 


Die Lösung des Gleichungssystems (5)-(7) erfolgt rückwärts 
im Planungszeitraum für t = T, Т-1,...,1. 


1) Eine Möglichkeit, diese Symmetrieannahme aufzuheben, 
besteht in der Verwendung von stückweise quadratischen 
Verlustfunktionen, wie sie von Friedman (1975) vorgeschla- 
gen werden. 


-B u -Cz), 
tt te 


Für t = T gilt wegen (5) 
(8) = К.У К.а. =H,Y_-h 


ти H = K+ ипа һь= Kar 


Aus (6), (7) und (8) erhalten wir für t = T: 


(9) , = < , M > 
BA, = 0 = P UH ALY + H Brut Baies ht 
Somit ergibt sich 
(10) ит = GrYr.( + Ет 
mit Gp = ~(B'pH,B,)' Bio Ba Ar 
und вр = —(B’>H,B,)' Biatl afin — bal. 


Die Matrizen BH B (t= 1...,.T) sind quadratisch von der Ordnung 

с und, um eine eindeutige Lösung zu erhalten, nehmen wir 

an, daß sie regulär seien. 

Aus (7) und (10) folgt: 

(11) Yr=(Ar + BrGy Yr, + Brgr + Crer 

Setzen wir (11) in (8) ein, so erhalten wir: 

(12) „= Н (А. + B.G Kar + Haagen + Bey) = Ap. 

Aus (12) und (5) folgt für T-1 

(13) Ar. 
mit Hp, = Kai АТН: (А: + BG) 


und hr, = Кут ar, -Z ArAr(Crr + B -gr) tA phe , 


und damit wegen (10) G,,und gx.) + Dieses Verfahren wird 


wiederholt fir T-2, T-3, usw. Es ergibt sich somit ein vom 
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Ende der Planungsperiode her berechnetes System von Matri- 


zen und Vektoren: 


Ay hp, Gp 8p App App Orr Er. 


Für beliebige t zwischen l und T gelten folgende Bezie- 


hungen: 
(14) u,=G,Y,, +8, und À, = H,Y, – h,, 
sowie 
G, = -—-(B'H,B)2IB'HA,, 
g, = -(B,H,BJ'B’,(H,C,z,-h). 
(15) 
H, = К, + AH, (A, + B,G2, Hr = Кт, 
hı = K, a. (А, +B, G} (h, – Н,С,2), Ap = Кта. 


Hiermit ist das deterministische lineare Entscheidungs- 
problem gelöst, die optimale Entscheidungsregel (14) ist 
linear und stellt i.a. eine Kombination aus proportionaler 
und differentialer Politik dar. 

Der optimale Zustandsverlauf wird entsprechend 


(16) Y, =(À, +B,GJ Y, 1 + B,g, + C,z,, t= 1,...,T, 


berechnet. Die minimalen Kosten ergeben sich durch Ein- 
setzen von (16) in die Verlustfunktion. 

3. Das ökonometrische Modell 

Für die Durchführung einer Sensitivitätsanalyse bezüglich 
der Zielfunktion dient das 6konometrische Modell von 


Frowen und Arestis (1976)! fiir die Bundesrepublik Deutsch- 


1) Siehe auch Arestis, Frowen und Karakitsos (1978). 
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land als Nebenbedingung zur Beschreibung des Wirtschafts- 
ablaufs. Es handelt sich hierbei um ein hochaggregiertes 
lineares dynamisches Modell typisch keynesianischer Bau- 
art, wie es häufig bei Fragestellungen des "demand mana- 
gement" benutzt wird. Neben den wesentlichen Komponenten 
des Bruttosozialprodukts enthält das Modell auch eine 
Geldangebots- und Geldnachfragefunktion. Entsprechend dem 
Anliegen der Autoren kann somit die Wirksamkeit geld- und 
fiskalpolitischer Maßnahmen in diesem Modell untersucht 
werden, wobei die Geldbasis und die Staatsausgaben als In- 
strumentvariablen gewählt werden. Das ursprüngliche Modell 
wurde um eine Definitionsgleichung für den Leistungsbi- 
lanzsaldo erweitert, so daß es nun aus 10 Gleichungen (3 
Definitionsgleichungen und 7 Verhaltensgleichungen) be- 
steht. Endogene Variable sind das Bruttosozialprodukt Y, 
das verfügbare Einkommen Yf, der private Verbrauch C, die 
Ausrüstungsinvestitionen I, die Bauinvestitionen BS, die 
Importe Q, die Geldmenge M (Geldmengendefinition M,), der 
kurzfristige Zinssatz Rs, der langfristige Zinssatz R, und 
der Leistungsbilanzsaldo A. Die exogenen Variablen sind: 
die Staatsausgaben G, die monetäre Basis B, die Exporte X 


und der Lombardsatz der Deutschen Bundesbank Rg: 


Die Schätzung des Modells basiert auf saisonbereinigten 
Quartalsdaten in laufenden Preisen von 1965(1) bis 1974(4) 
Sie erfolgte mittels der zweistufigen Methode der Klein- 
sten Quadrate, wobei Autokorrelationsbereinigung 1.Ordnung 
durchgeführt wurde, soweit dies erforderlich war. Die t- 
Werte der geschätzten Parameter weisen jeweils auf eine 


relativ gute Absicherung der Variablen hin. 


Durch Einführung von 3 Hilfsvariablen können wir das Mo- 
dell als Differenzengleichungssystem 1. Ordnung schreiben. 
Siehe hierzu Übersicht 1. 


1) 


2) 


3) 


4) 


5) 


6) 


7) 


8) 


9) 


10) 


11) 


12) 


13) 


Übersicht 1: Modelldarstellung als Differenzengleichungssystem 1. Ordnung 


Y = C, + I + BS, + 6. + X, - Q, 


t t 

vd = 0.630 Y, 

сү = 5.435 + 0.558 ҮЙ, + 0.051 M, + 0.212 С, + u, 

I, = 2.364 + 0.016Y, + 0.162 С) - 0.162 E,.) + 0.899 I,_, - 0.425 Е) + ur 

BS, = 0.888 + 0.142 Y, - 0.112 ¥,_) + 0.842 BS,_, - 0.743 Rp, + 0.587 Б, -0.042 HL) + u, 

Q, = -2.388 + 0.819 Q,_, + 0.292 Y, - 0.239 ү, + u, 

Rup = 0.823 + 0.019 Y, - 0.015 ¥,_, + 0.770 Вр] + 0.178 Ro, - 0.137 В; у + u, 

M, = -4.465 + 0.186 Y, - 0.529 Ro, + 0.878 М) + u, 

Rot = 15.173 + 1.119 M, - 0.834 М] + 0.745 Ben - 3.547 В, + 2.643 В, + 0.867 Rgt 
-0.646 Rat-1 + u, 

А, = X, - Q, 

Ер = С 

Fe RLt-1 

H, = BS,-1 


CEL 
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Alle Eigenwerte des Modells sind positiv und kleiner als 


Eins. Der maximale Eigenwert beträgt 0.832. Somit handelt 


es sich um eın stabiles Modell mit monoton verlaufenden 


Einschwingpfaden. 


Tabelle 1: 


Kumulierte Multiplikatoren: Auswirkungen 
einer dauerhaften Erhöhung von G, B um 1 
Einheit auf das Bruttosozialprodukt Y und 


die Geldmenge M. 


1.237 oan [о.145 1.230 
1.463 


2.860 


2.838 
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Die dynamischen Multiplikatoren des Modells in Tabelle 1 
geben Aussagen über die Wirkung von Änderungen der Staats- 
ausgaben bzw. der Geldbasis auf das Bruttosozialprodukt 
und auf die Geldmenge. Die langfristigen Multiplikatoren 
zeigen, daß der Effekt einer dauerhaften Staatsaus- 
gabenerhöhung um eine Einheit auf das Bruttosozialprodukt 
größer ist (1.142) als der Effekt einer gleich großen 
dauerhaften Erhöhung der monetären Basis (0.809). Wird 
dagegen die Geldmenge als Zielvariable gewählt, so bewirkt 
eine permanente Erhöhung der Geldbasis um eine Einheit 
eine Erhöhung von 2.838 Einheiten, während eine ent- 
sprechende Erhöhung der Staatsausgaben die Geldmenge nur 
um 0.298 Einheiten erhöht. Aus den kumulierten Multipli- 
katoren folgern wir, daß sich Änderungen der Staats- 
ausgaben jeweils schneller auf das Bruttosozialprodukt 
bzw. auf die Geldmenge auswirken als eine Änderung der 
Geldbasis. Die Beurteilung der relativen Wirksamkeit von 
geld- bzw. fiskalpolitischen Maßnahmen läßt sich aller- 
dings nur dann vernünftig durchführen, wenn entsprechende 
Zielfunktionen als Kriterien benutzt werden. Dies ist 
sicherlich ein Vorteil, den der kontrolltheoretische 


Ansatz gegenüber der dynamischen Multiplikatoranalyse 


besitzt. 
4, Durchführung der Sensitivitätsanalyse 


4.1 Der Aufbau der Experimente 


In den folgenden Abschnitten wollen wir verschiedene kon- 
trolltheoretische Experimente durchführen, die Aufschluß 
über die Reagibilität der optimalen Politikregeln bezüg- 
lich Variationen in den Parametern der Zielfunktion geben 
sollen. Zur Berechnung dient das Programm von Butters und 
Chow (1977). 
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Grundlegend für die Sensitivitätsanalyse sind bestimmte 
Annahmen über die Zielfunktion, die bei den jeweiligen 
Experimenten variiert werden. Als Zielfunktion verwenden 
wir hier die quadratische Verlustfunktion, da sie ohne 
große Schwierigkeiten zu einer optimalen Lösung des Ent- 
scheidungsproblems führt und da sie als Taylorreihenappro- 
ximation zweiter Ordnung für eine allgemeinere Ziel- 
funktion aufgefaßt werden kann. Zu Beginn des Entschei- 
dungsprozesses muß der Entscheidungsträger seine Ziel- und 
Instrumentvariablen auswählen, die in der Zielfunktion mit 
positiven Gewichten entsprechend seiner Präferenzordnung 
versehen werden sollen. Die restlichen Zustandsvariablen, 
die für den Entscheidungsträger nicht unmittelbar inter- 
essant sind, werden mit Gewichten von Null bewertet. Ihr 
Sollpfad kann deshalb auch beliebig verlaufen, er hat 
keinen Einfluß auf das Optimierungskalkül. Die Werte der 
echt exogenen Variablen seien bekannt, sie folgen ihren 
historischen Werten. Da die Variation von Instrument- 
variablen Kosten verursacht und gewissen Restriktionen un- 
terliegt, werden die Instrumente in der Zielfunktion mit 
positiven Gewichten bewertet. Weiterhin garantiert die In- 
strumentenbewertung die Eindeutigkeit der optimalen Lö- 
sung, wenn die Anzahl der Instrumentvariablen größer ist 
als die der Zielvariablen. In unseren Experimenten wählen 
міс die Staatsausgaben G und die monetäre Basis B als In- 
strumentvariablen, um so die unterschiedlichen Effekte 
fiskal- und geldpolitischer Maßnahmen auf den optimalen 
Zustandsverlauf untersuchen zu können. Der Instrumenten- 
einsatz soll hier auf die endogenen Variablen Brutto- 
sozialprodukt Y, Geldmenge M und Leistungsbilanzsaldo A 
gerichtet sein; d.h. daß im Rahmen der unterstellten 
Modellökonomie Fragen eines stetigen und angemessenen 
Wachstums, eines außenwirtschaftlichen Gleichgewichts und 


einer angemessenen Geldversorgung der Wirtschaft behandelt 
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werden. Eine explizite Berücksichtigung von Inflation und 


1), da das ver- 


Arbeitslosigkeit läßt sich nicht durchführen 
wendete Modell nicht die güterwirtschaftliche Angebots- 
seite berücksichtigt. Alle übrigen Zustandsvariablen 
sollen im folgenden nicht bewertet werden. Eine weitere 
wichtige Komponente der Zielfunktion (Verlustfunktion) ist 
die Festlegung der Sollpfade (Zielpfade) für die bewer- 
teten Zustandsvariablen. Die Sollpfade der Zielvariablen 
repräsentieren die vom politischen Entscheidungsträger ge- 
wünschten Zeitpfade der Variablen. Für die gewünschten 
Sollpfade der Ziel- und Instrumentvariablen unterstellen 
wir, daß sie sich mit konstanten Wachstumsraten ent- 
wickeln. Als Anfangsperiode für die Optimierung wählen wir 
das 4. Quartal 1971, d. h. die Werte aller Variablen sind 
für diese Startperiode bekannt. Es sind die historischen 
Werte bis auf den Anfangswert von A im Zielpfad 1, da hier 
für die gesamte Planungsperiode eine ausgeglichene Lei- 
stungsbilanz unterstellt wird. Im folgenden unterscheiden 


wir zwei Zielpfade. 


Übersicht 2: Vierteljährliche Wachstumsraten der Zielpfade 
für die Ziel- und Instrumentvariablen. 


неа 
Zielpfad 1 2 % S Е 0% 4% 2,5% 
Zielpfad 2 -50% 3% 3% 


ee 


1) Für eine kontrolltheoretische Behandlung des trade-offs 
zwischen Inflation und Arbeitslosigkeit siehe z.B. Franz, 
Kempf und Kräger (1984), sowie Franz und Kräger (1980). 
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Der Zielpfad 1 orientiert sich mit Ausnahme des Leistungs- 
bilanzsaldos an der historischen Entwicklung der Variablen 
für den Zeitraum 71 (1) - 74 (4). Die gewählten Wachstums- 
raten entsprechen in etwa den Mittelwerten der beobach- 
teten Wachstumsraten. Hierdurch versuchen wir, eine ver- 
Stetigende Entwicklung der Ziel- und Instrumentvariablen 
im Vergleich zu den Modellprognosen zu erreichen. Der 
Zielpfad 2 ist so gewählt, daß der in 71 (4) herrschende 
Anteil der Staatsausgaben am Bruttosozialprodukt sowie der 
Anteil der monetären Basis an der Geldmenge (Geldmengen- 
multiplikator) im Zeitablauf konstant bleibt und zusätz- 
lich ein sukzessiver Abbau des in der Startperiode exi- 


Stierenden Leistungsbilanzüberschusses erfolgt. 


Die adäquate Gewichtung der Zielvariablen in der Zielfunk- 
tion ist sehr schwierig, da sie die Präferenzvorstellungen 


1), Hierbei 


des Wirtschaftspolitikers widerspiegeln soll 
ist zu beachten, daß die entstehenden Kosten, die als qua- 
drierte Abweichungen der Optimalpfade von den Zielpfaden 
dargestellt sind, von den Dimensionierungen der Variablen 
und den vorgegebenen Gewichten abhängig sind. Zur Festle- 
gung der Präferenzordnung ist der Zielerreichungsgrad für 
die in das Entscheidungskalkül einbezogenen Variablen ent- 
scheidend. Es ist also für jede Variable ihre Anpassung an 
den vorgegebenen Zielpfad zu beurteilen und diese Anpas- 
sungen sind für die einzelnen Variablen miteinander zu 
vergleichen. Um diese Vergleichbarkeit zu gewährleisten, 
verwenden wir im folgenden als Gütemaß zur Beurteilung der 


Anpassung für jede bewertete Variable die Wurzel der mitt- 


1) Es wird z. B. versucht, die Gewichte so zu wählen, daß 
"äquivalente Abweichungen" (siehe Gruber (1980)) oder 
gleiche prozentuale Abweichungen der Optimalpfade von den 
Zielpfaden (Kuhbier (1980)) gleiche Verluste ergeben. Man 
könnte auch versuchen, die Gewichte so zu wählen, daß alle 
Zielvariablen den gleichen Anteil zur Verlustfunktion 
beisteuern (Kuhbier (1981)). 
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leren quadrierten prozentualen Abweichung zwischen dem Op- 


timalpfad y, und dem zugehörigen Zielpfad а,. 


Somit gilt, mit Т als Planungshorizont: 


IS I 


we 
(17) Оток = |1 N ( =. 100 ) | 


Nur für den Fall, daß der Zielpfad a, Nullen enthält, 
messen wir die Güte der Anpassung durch die Wurzel der 


mittleren quadrierten Abweichung zwischen Optimal- und 
Sollpfad: 
š l 
. E &= | 5 
18 Pa lN 2 |2 
(18) UFA 0-а) | 


б=1 


Ein Vergleich der numerischen Werte gleicher Anpassungs- 
maße legt die Präferenzordnung bezüglich der Zielerrei- 
chung fest, wobei bei vollständiger dynamischer Kontrol- 
lierbarkeit bestimmter Variablen deren U-Werte verschwin- 


den. 


Als Basislauf (1) bezeichnen wir im folgenden den Optimie- 
rungslauf, der bei einer Gleichgewichtung aller Ziel- und 
Instrumentvariablen und Konstanz der Gewichte in allen Pe- 
rioden einen Optimierungszeitraum von 5 Perioden sowie den 
Zielpfad 1 verwendet. Alternative Optimierungsläufe er- 
halten wir durch Variation von Parametern in der Zielfunk- 
tion, wobei als unveränderbare Rahmenbedingung das öko- 
nometrische Modell vorgegeben ist, das den Entscheidungs- 


gremien mit Sicherheit bekannt sei. Die geschätzten Struk- 
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turparameter werden daher als feste Größen behandelt und 
die Restgrößen in den Strukturgleichungen auf ihren Erwar- 


tungwert von Null gesetzt. 1) 


4.2 Experiment 1: Variation des Planungshorizontes 


Eine wichtige Komponente der Zielfunktion ist der Pla- 
nungshorizont, d. h. der Zeitraum, über den optimiert wer- 
den soll. In diesem ersten Experiment wollen wir unter- 
suchen, wie sensitiv die optimalen Verläufe der Ziel- und 
Instrumentvariablen bezüglich einer Variation des Pla- 
nungshorizontes sind. Ausgangspunkt der Analyse ist der 
Basislauf (l), der Optimierungszeitraum beträgt hier 5 
Perioden. In allen Läufen wählen wir die gleiche Anfangs- 
periode 71 (4), d. h. die erste Periode, für die optimale 
Feedback-Regeln abgeleitet werden, ist 72 (1). Die Opti- 
mierungsläufe (2) und (3) unterscheiden sich vom Basislauf 
durch die Länge des Planungshorizontes. Lauf (2) erstreckt 
sich über 9 Perioden (bis 74 (1)), während Lauf (3) über 
13 Perioden (bis 75 (1)) geht. Die U-Werte haben wir für 
den Lauf (2) auch für die ersten fünf Perioden (U?) bzw. 
für Lauf (3) für die ersten fünf und neun Perioden (U? und 
U?) getrennt berechnet, um die Anpassung für gleiche Zeit- 
räume vergleichen zu können. Die Ergebnisse sind in 


Tabelle 2 zusammengefaßt. 


In den Schaubildern I(a) bis (e) sind für die Zielva- 
riablen Y, M, A und für die Instrumentvariablen G und B 
ihre jeweiligen Optimalpfade (1), (2), (3) zusammen mit 
ihren vorgegebenen Zielpfaden und ihren Prognosewerten 


gezeichnet. 


1) Die Vernachlässigung des Einflusses der Residuen im 
linear-quadratischen Optimierungsansatz läßt sich mit dem 
certainty-equivalence Prinzip begründen. 
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Vergleichen wir die optimalen Verläufe der Ziel- und In- 
strumentvariablen in (1), (2) und (3) bis zur 5. Periode 
bzw. in (2) und (3) bis zur 9. Periode, dann sehen wir, 
daß die entsprechenden Optimalpfade jeweils nur geringfü- 
gig voneinander abweichen, sowohl was die zeitliche Ent- 
wicklung als auch die entsprechenden UŽ - bzw. U?-Werte be- 
trifft. Für das Bruttosozialprodukt Y einerseits Sowie die 
Geldmenge M und den Leistungsbilanzsaldo andererseits 
zeigt sich dabei eine gegenläufige Entwicklung bezüglich 
der Anpassung an die vorgegebenen Sollpfade für die ersten 
fünf Perioden. Während diese Anpsassung für M und A mit 
zunehmendem Planungshorizont besser wird, verschlechtert 


Sie sich für Y. 


Tabelle 2: Auswirkungen alternativer Planungshorizonte bei 
konstanter Gewichtung im Zeitablauf und Vorgabe 


von Zielpfad 1. 


1 (Т= 5) 2 (Т = 9) 3 (Т = 13) 
Се- Се- Ge- 
Variable wichte wichte wichte 


RER EE 
=} озот т [ташлы ози 1 
| А?” [23 5.835| 3.973 um 
a" _1_ 
в f ИШ 


> 
© 
N 
w 
N 
N 
de 
w 


*)Hier wurde U, benutzt. 


Betrachten wir die gesamte Entwicklung der Optimalpfade in 
(1), (2) und (3), so stellen wir fest, daß die durch- 


schnittlichen Abweichungen der Optimalpfade von den jewei- 
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ligen Zielpfaden mit zunehmendem Planungshorizont im Zeit- 
ablauf monoton größer werden. Die ul3-Werte in (3) haben 
sich im Vergleich zu den U°-Werten in (l) und zu den U?- 
Werten in (2) wesentlich erhöht. Auch hier zeigt sich, daß 
mit zunehmendem Planungshorizont die Anpassungen für das 
Bruttosozialprodukt Y im Mittel wesentlich schlechter 
werden als für die Geldmenge M und den Leistungsbilanz- 


saldo A. 
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Weiterhin ist festzustellen, daß kurzfristig (bei einem 
Planungshorizont von 5 Perioden) das Bruttosozialprodukt 
besser gesteuert wird als die Geldmenge, während länger- 
fristig (bei Planungshorizonten von 9 und 13 Perioden) die 
Geldmenge besser kontrollierbar ist als das Bruttosozial- 


produkt. 


4.3 Experiment 2: Alternative Zeitpräferenzen 


Die Konstanz der Gewichtung allet Ziel- und Instru- 
mentvariablen über den gesamten Planungszeitraum (wie in 
Experiment 1) entspricht einer gleichbleibenden, zeitlich 
invarianten Präferenzstruktur des Entscheidungsträgers. In 
vielen Fällen ist es aber sicherlich realistischer, gewis- 
se Zeitpräferenzen hinsichtlich der Zielerreichung zu 
unterstellen. Deshalb wollen wir im folgenden das Ver- 
halten der Optimalpfade bezüglich einer Diskontierung der 
Gewichte analysieren. Die Optimierungsläufe in diesem Ex- 
periment sind so gewählt, daß jede Ziel- und Instrumentva- 
riable in jeder Periode das gleiche Gewicht besitzt. Die 
Diskontierung der Gewichte g, im Zeitablauf formulieren wir 
in konstanten Wachstumsraten, d. h. die zeitliche Entwick- 
lung ist gegeben durch g, = a(l + B)*, t = 1,2,...,T. Веі 
vorgegebener Wachstumsrate ß wählen wir a so , daß g, = 1 
1st. Der Optimierungszeitraum betràgt 13 Perioden. Als 
vorgegebener Sollpfad wird der Zielpfad 1 unterstellt. Ta- 
belle 3 zeigt in den Läufen (4) bis (8) die Ergebnisse für 
Wachstumsraten der Gewichte von 10 %, 20 %, 50 %, 100 a 
und von -50 %. In den Schaubildern II (a) bis (e) sınd für 
jede Ziel- und Instrumentvariable neben dem jeweiligen 
vorgebenen Zielpfad die Optimalpfade für die Läufe (3), 
(6) und (8) dargestellt. 


Betrachten міг zunächst die Optimierungsläufe mit 


einem 


im Zeitablauf bei 


Auswirkungen alternativer Diskontierungen der Gewichte 
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*) Hier wurde U, benutzt. 
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zunehmenden Gewichtungen (4) bis (7), so sehen wir, daß 
mit steigendem Diskontierungsfaktor die U-Werte im allge- 
meinen ebenfalls zunehmen. Dies resultiert aus einer 
schlechter werdenden Anpassung in den ersten Perioden, wie 
aus den U- bzw. U?-Werten in Tabelle 3 sowie den Schau- 
bildern II deutlich wird. Insbesondere die Variablen G, Y 
und A reagieren sehr sensitiv in den ersten Perioden auf 
eine Vergrößerung der Wachstumsraten für die Gewichte. Es 
treten sehr große Schwankungen in ihren Optimalpfaden auf. 
Dagegen ergibt sich für die Geldmenge M und die. monetäre 
Basis B eine sehr geringe Sensitivität bezüglich alter- 


nativer Diskontierungen der Gewichtspfade. 
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Die Ergebnisse in Tabelle 3 zeigen außerdem, daß die 
Optimalpfade auf relativ kleine Wachstumsraten der Ge- 
wichte (im Beispiel bis 20 %) nur sehr schwach reagieren; 
erst bei großen Wachstumsraten sind die Veränderungen der 


optimalen Lösungen erheblich. 


Aus den Resultaten des Optimierungslaufs (8) sehen wir 
dagegen, daß die Sensitivität der Optimalpfade hinsicht- 
lich einer abnehmenden Gewichtung wesentlich geringer ist. 
Diesen Lauf können wir direkt mit Lauf (6) vergleichen, da 


die gleichen absoluten Wachstumsraten gewählt wurden. 


Während die Optimalpfade von Lauf (6) teilweise sehr stark 
schwanken, verlaufen die Optimalpfade von (8) über den 
gesamten Planungszeitraum fast parallel zum Lauf (3). Die 
minimale Bewertung der letzten Perioden (im Vergleich zum 


Lauf (3)) hat kaum Auswirkungen auf die Optimalpfade. 
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4.4 Experiment 3: Variation des Zielpfades 


Im folgenden wiederholen wir die ersten beiden Experimente 
für den Zielpfad 2, um festzustellen, ob die generellen 
Aussagen bezüglich des Einflusses des Planungshorizontes 


und der Zeitpräferenz vom gewählten Zielpfad abhängen. 


Tabelle 4 und die Schaubilder III (a) bis (e) zeigen den 
Einfluß alternativer Planungshorizonte auf. Wir erhalten 


im Prinzip dieselben Resultate wie beim Experiment 1: 


Die Optimalpfade der Zielvariablen weichen in den Läufen 
(9), (10) und (11), über 5 Perioden gesehen, (bzw. in den 
Läufen (10) und (11) über 9 Perioden) kaum voneinander ab. 
Die Veränderungen in den U-Werten sind für vergleichbare 
Zeiträume sehr gering, während mit zunehmendem Zeithori- 
zont die Abweichungen der Optimalpfade von den vorgege- 


benen Zielpfaden immer größer werden. 


Die Ergebnisse für das Experiment 2 mit Zielpfad 2 sind in 
Tabelle 5 und den Schaubildern IV (a) bis (e) zusammen- 
gefaßt. Im wesentlichen können wir dieselben Schlußfol- 
gerungen ziehen wie beim entsprechenden Experiment mit 
Zielpfad 1: 


Die Optimierungsläufe (12) und (13) (mit zunehmenden 
Gewichten im Zeitablauf) zeigen, daß mit steigender Wachs- 
tumsrate die Anpassungen der Optimalpfade an die Zielpfade 
im Mittel schlechter werden. Dies wird durch stärkere Ab- 
weichungen der Variablen von ihren Sollwerten in den er- 


sten Perioden verursacht. 


Bei abnehmender Gewichtung (Lauf 14) entwickelt sich der 
jeweilige Optimalpfad fast parallel zu Lauf (11), der 
keine Zeitpräferenz unterstellt. Es treten in (14) keine 


Schwankungen wie bei den Läufen (12) und (13) auf. 


Tabelle 4: 


Auswirkungen alternativer Planungshorizonte bei konstanter Gewichtung 
Zeitablauf und Vorgabe von Zielpfad 2. 
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Tabelle 5: 


Auswirkungen alternativer Diskontierungen der Gewichte 
Planungshorizont von T = 13 Perioden, Vorgabe von Zielpfad 2 
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Somit sind für die hier durchgeführten Experimente die 
generellen Aussagen hinsichtlich der Variation des 
Planungshorizontes und hinsichtlich der zeitlichen Diskon- 
tierung der Gewichte weitgehend unabhängig von der Wahl 
der Zielpfade. 


Ein Vergleich der Läufe (1), (2) und (3) mit den jeweils 
entsprechenden Läufen (9), (10) und (11) für den Zielpfad 
2 verdeutlicht die Sensitivität der Optimalpfade hinsicht- 
lich einer Veränderung der Zielpfade. Es ergeben sich 


teilweise beträchtliche Unterschiede im gesamten Verlauf 
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der entsprechenden Optimalpfade, als auch in der Güte be- 
züglich der Anpassung an die vorgegebenen Pfade. So zeigt 
sich beispielsweise bei einem Planungshorizont von 5 Peri- 
oden, daß bei Vorgabe von Zielpfad 1 Y besser gesteuert 
werden kann als M (Lauf (1)), während bei Vorgabe von 
Zielpfad 2 und sonst gleichen Bedingungen М wesentlich 


besser gesteuert werden kann als Y (Lauf (9)). 


In diesem Zusammenhang stellt sich nun die Frage, wie man 
die Anpassung der Zielvariablen an ihre Sollpfade ver- 
bessern kann. Eine Möglichkeit dies zu erreichen, besteht 
darın, anzunehmen, daß der Einsatz der Instrumentvariablen 
(fast) kostenlos ist. Die Instrumentvariablen werden hier 
im Vergleich zu den Zielvariablen nur minimal bewertet. 
Die Verläufe der Zielpfade der Instrumentvariablen haben 
somit nahezu keinen Einfluß auf die Ergebnisse des 
Optimierungskalküls. Es sind also beliebig große Varia- 
tionen der Instrumente möglich.!! Bei Vorgabe von Zielpfad 
2 zeigt sich in Tabelle 6, daß wir im Vergleich zu Lauf 
(9) in Lauf (15) eine wesentlich bessere Anpassung der 
Zielvariablen an die vorgegebenen Sollpfade erreichen. Ob- 
wohl wir drei Ziele mit nur zwei Instrumenten steuern, 
gelingt es, die Geldmenge M vollständig an ihren Zielpfad 
anzupassen. Wählen wir nur Y und M als Zielvariablen (Lauf 
(16)), so lassen sie sich durch die Staatsausgaben und die 
monetdre Basis vollständig dynamisch kontrollieren. Dieses 
Ergebnis ist unabhängig vom vorgegebenen Zielpfad, denn 
die Läufe (17) und (18), bei denen der Zielpfad 1 unter- 


stellt wird, lassen dieselben Schlußfolgerungen zu. 


1) Die Frage der praktischen Realisierbarkeit wird dabei 
natürlich ausgeklammert, es werden vielmehr Fragen nach 
der Kontrollierbarkeit gestellt. 
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Tabelle 6: Anpassung der Optimalpfade an vorgegebene 
Zielpfade bei einem Planungshorizont von 5 


Perioden. 


Zielpfad 2 Zielpfad 1 
Ge- Ge- Ge- | 
wichte wichte wichte 


007 or |e 
Et 


*) Hier wurde U, benutzt. 


4.5 Experiment 4: Unterschiedliche Gewichtun der Ziel- 


varıablen 


Durch unterschiedliche Bewertung in der Kostenfunktion 
kommen die Präferenzen des Entscheidungsträgers hinsicht- 
lich der einzelnen Ziele zum Ausdruck. Mit Hilfe kontroll- 
theoretischer Untersuchungen ist es möglich, die gegensei- 
tige Beeinflussung und Abhängigkeit zweier Zielvariablen 
sichtbar zu machen. Die quadratische Verlustfunktion wird 
hier häufig zur Ermittlung substitutionaler Austausch- 
relationen (trade-offs) hinsichtlich der Anpassung be- 
stimmter Zielvariablen an ihre gewünschten Pfade benutzt. 
Im folgenden Experiment versuchen wir, einen trade-off 
bezüglich der Stabilisierung des Bruttosozialprodukts und 


der Geldmenge zu bestimmen. 
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Wie im Basislauf wählen wir für dieses Experiment den 
Zielpfad 1, der Optimierungszeitraum beträgt 5 Perioden. 
Die Instrumentvariablen G und B, sowie die Zielvariable A 
werden in allen Perioden mit 1 gewichtet. Y und M werden 
unterschiedliche Gewichte zugeordnet, um so einen trade- 
off ermitteln zu können. Wir beginnen mit Lauf (19), in 
dem Y mit 1 und M mit 0 bewertet werden, d. h. die 
Entwicklung von M ist für den Entscheidungsträger be- 
deutungslos. In den folgenden Optimierungsläufen soll die 
Gewichtung des Bruttosozialprodukts. laufend abnehmen, 
während die Bewertung der Geldmenge gleichermaßen zunimmt, 
d. h. Stabilisierung von M wird im Vergleich zur Stabili- 
sierung von Y immer wichtiger. Die entsprechenden Ergeb- 
nisse sind in Tabelle 7 und in Schaubild V zusammen- 
gestellt. 


Schaubild V: 
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Dieses Experiment zeigt sehr deutlich die Existenz eines 
trade-offs zwischen der Stabilisierung des Bruttosozial- 
produkts Y und der Geldmenge M. Ausgehend vom Basislauf 
(1) läßt sich eine bessere Stabilisierung der Geldmenge, 
d. h. eine bessere Anpassung dieser Variablen an ihren 
Sollpfad, nur auf Kosten einer schlechteren Stabilisierung 


Tabelle 7: 


лаш. 


Bestimmung eines trade-offs zwischen der Stabilisierung von 


Vorgabe von Zielpfad 1 und einem Planungshorizont von 5 Perioden. 
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*) Hier wurde U, benutzt 


Y 


und M bei 


LSL 
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von Y erreichen, wenn durch die vorgegebene Gewichtung für 
die Instrumente, diese in einen zulässigen Bereich gezwun- 


gen werden. 


Aufgrund dieses trade-offs ist keine gleichzeitige, voll- 
ständige Anpassung der Varıablen Y und M an ihre vor- 
gegebenen Zielwerte möglich, solange die Instrumente nicht 
völlig frei variieren können. Die unterschiedliche Bewer- 
tung der Zielvariablen hat auch Einfluß auf die optimalen 
Verläufe der Instrumentvariablen; sie macht Abhängigkeiten 


zwischen Ziel- und Instrumentvarıablen deutlich. 


Tabelle 7 zeigt, daß die U-Werte von G bzw. B durch die 
Gewichtung von Y bzw. M verändert werden. Die abnehmende 
Bewertung von Y besagt, daß die Abweichung dieser Vari- 
ablen von ihrem Zielpfad für den Entscheidungsträger immer 
weniger Bedeutung hat, d. h. die Steuerung von Y verur- 
sacht für den Einsatz der beeinflussenden Instrumentvari- 
ablen weniger Kosten, also muß die Instrumentvariable, die 
hauptsächlich auf Y wirkt, abnehmende U-Werte aufweisen, 
während umgekehrt die Instrumentvariable, die für die 
Regelung von M hauptsächlich zuständig ist, i. a. zuneh- 
mende U-Werte aufweisen wird. Somit zeigt sich die erwar- 
tete Abhängigkeit von G und Y bzw. B und M. 
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4.6 Experiment 5: Unterschiedliche Gewichtung der In- 


strumentvariablen 


Durch eine unterschiedliche Bewertung der Instrumentva- 
riablen in der Zielfunktion erhalten wir Aufschluß über 
die Effizienz alternativer, politischer Maßnahmen. Auf 
diese Weise können wir auch analysieren, welche Zielvari- 
ablen durch welche Instrumentvariablen gesteuert werden. 
Grundlage für dieses Experiment bildet der Zielpfad 1, 
sowie ein Planungszeitraum von 5 Perioden. Die einzelnen 
Zielvariablen haben in allen Perioden das gleiche Gewicht, 
d. h. es wird keine Zeitpräferenz unterstellt. Tabelle 8 


enthält die entsprechenden Ergebnisse. 


Wir versuchen, durch eine unterschiedliche Bewertung der 
geld- bzw. fiskalpolitischen Maßnahmen deren Wirkungen auf 
die Zielvariablen Bruttosozialprodukt und Geldmenge zu 


analysieren. 


In den Optimierungsläufen (24) und (25) gewichten wir die 
Staatsausgaben mit O, d. h. G ist an keinen Sollpfad ge- 
bunden. Die Staatsausgaben können ohne Kosten so gewählt 
werden, daß sie das Entscheidungsmodell optimieren. Wegen 
der steigenden Gewichtung für die Geldbasis läuft die 
Steuerung des Modells in zunehmendem Maße über G. Durch 
diese stärkere Anbindung von B an seinen Sollpfad zeigt 
sich, welchen Einfluß B auf den Optimierungsprozeß ausübt. 
Ein Vergleich der Läufe (24) und (25) ergibt, daß die Ab- 
weichungen der Zielvariablen Y und M von ihren gewünschten 
Pfaden bei zunehmender Gewichtung von B größer werden. Die 
U-Werte von Y verändern sich aber nur geringfügig, während 
die von M sehr stark ansteigen. Hieraus folgern wir, daß B 
vorwiegend den Optimalpfad von M steuert, aber auch einen 


gewissen Einfluß auf die Steuerung von Y hat. 


Tabelle 8: Auswirkungen unterschiedlicher Gewichtungen der 
Instrumentvariablen bei Vorgabe von Zielpfad 1 
und einem Planungshorizont von 5 Perioden. 
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Um die Wirkung der Staatsausgaben auf die Zielvariablen 
bestimmen zu können, nehmen wir in den Läufen (26) und 
(27) an, daß der Einsatz der Geldbasis kostenlos sei, d.h. 
die Steuerung der Variablen verläuft hauptsächlich über B, 
während die Staatsausgaben in zunehmendem Maße an einen 
vorgegebenen Sollpfad angepaßt werden. Die U-Werte der 
Zielvariablen zeigen deutlich, daß G sowohl Y als auch M 
stark beeinflußt. In den Läufen (1), (28) und (29) wird 
die Bewertung von G konstant gleich Eins gehalten, während 
die Gewichtung von B stark variiert. Es ergibt sich hin- 
sichtlich der Wirksamkeit der Instrumente, daß mit zuneh- 
menden Kosten für B die Anpassungen von M schlechter wer- 
den. Die Staatsausgaben übernehmen in diesen Läufen im 
Vergleich zur monetären Basis einen immer größer werdenden 
Anteil der Systemsteuerung, da sie, relativ zu B, weniger 
an ihren Sollpfad gebunden sind. Dies hat auch Auswirkun- 
gen auf Y, die U-Werte von Y nehmen ab, d. h. die Stabi- 
lisierung von Y wird wegen des relativ billigeren Ein- 
Satzes von G besser. In den Läufen (1), (30) und (31) 
bleibt die Bewertung von B konstant, während die Gewich- 
tung von G sukzessive erhöht wird. Dies hat folgenden 
Effekt auf die Zielvariablen: Das Bruttosozialprodukt Y 
läßt sich schlechter stabilisieren, da G mit zunehmender 
Gewichtung immer mehr an seinen Sollpfad gebunden wird und 
so seinen Einfluß auf die Steuerung der Zielvariablen Y 
und M verliert. Die U-Werte von M bleiben in etwa gleich. 
Obwohl die Steuerung des Modells mehr und mehr von B 
übernommen wird, erhalten wir trotz des relativ kosten- 
günstigeren Einsatzes von B keine Verbesserung in den U- 


Werten von M. 


Werden die Instrumentvariablen im Vergleich zu den Ziel- 
variablen wesentlich höher bewertet (vgl. Lauf (32)), dann 
unterliegen die eingesetzten Politiken strengeren Restrik- 


tionen, d. h. für ihre optimalen Werte wird der zulässige 


162 


Bereich eingeschränkt. Die Steuerung der Zielvariablen 


wird hier im Vergleich zum Basislauf erschwert. 


Zusammenfassend können wir aufgrund dieses Experiments 
folgern, daß die monetäre Basis hauptsächlich zur Stabi- 
lisierung der Geldmenge geeignet ist, während die 
Staatsausgaben, obwohl sie primär das Bruttosozialprodukt 


stabilisieren, ebenfalls die Geldmenge steuern. 


4.7 Experiment 6: Stabilisierung mit nur einem Instru- 
ment 


Unsere kontrolltheoretischen Untersuchungen basierten bis- 
her immer auf der Annahme, daß zwei Instrumentvariable 
(Staatsausgaben und Geldbasis) zur Steuerung bestimmter 
Zielvariablen eingesetzt werden. Dies läßt sich als koope- 
ratives Verhalten der Entscheidungsträger Staat und Bun- 
desbank bei ihren wirtschaftspolitischen Maßnahmen inter- 
pretieren. Im folgenden wollen wir diese Annahme über das 
Verhalten der Entscheidungsträger aufheben; stattdessen 
wollen wir untersuchen, welches Instrument zur Stabi- 
lisierung der Zielvariablen besser geeignet ist, wenn das 
jeweils andere Instrument dem Einflußbereich des Entschei- 
dungsträgers entzogen ist, d. h. es wird im Optimierungs- 
ansatz als echt exogene Variable behandelt und folgt damit 


seinen historischen Werten. 


In Tabelle 9 beträgt der Optimierungszeitraum 5 Perioden, 
die Abweichungen der Zielvariablen und des jeweiligen In- 
struments werden vom Zielpfad 1 gemessen und die Zielvari- 
ablen Y, M und A werden in jeder Periode konstant mit Eins 
bewertet. Für die jeweils eingesetzten Instrumentvariablen 
міса angenommen, daß ihre Variation mit gewissen Kosten 
verbunden ist (Lauf (33) und (35)) als auch, daß ihr 
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Einsatz nahezu kostenlos erfolgen kann (Lauf (34) und 
(36)). 

Bei einem Vergleich der Läufe (33) und (34) bzw. (35) und 
(36) wird die aufgrund des vorherigen Experiments festge- 
stellte Zuordnung von Instrumentvariablen zu Zielvariablen 
nicht unmittelbar bestätigt. Bei Vorliegen von drei Zielen 
und nur einem Instrument ist es schwierig, eindeutige 


Ziel-Mittel-Kombinationen zu finden. 


Um die Analyse zu vereinfachen, sollen bei sonst gleichen 
Bedingungen in den folgenden Optimierungsläufen nur noch 
die beiden Variablen Bruttosozialprodukt und Geldmenge 


stabilisiert werden. 


Aus einem Vergleich der Läufe (37) bis (40) in Tabelle 10 
folgt, daß die Staatsausgaben allein in der Lage Sind, das 
Bruttosozialprodukt in sehr großem Ausmaß zu stabili- 
sieren. Ein fast kostenloser Einsatz von G verbessert die 
U-Werte von Y erheblich bei einer gleichzeitigen gering- 
fügigen Verbesserung der U-Werte von M. Bei alleiniger 
Geldpolitik bewirkt eine nahezu kostenlose Einsatz- 
möglichkeit der monetären Basis bei beiden Zielen nur eine 
geringfügige Verbesserung der Anpassung an die gewünschten 
Pfade. Weiterhin zeigt sich, daß die Fiskalpolitik auf das 
Bruttosozialprodukt wesentlich stärker wirkt als die 
Geldpolitik, da die U-Werte von Y in den Läufen (37) und 
(38) viel niedriger liegen als in den Läufen (39) und 
(40). Die Steuerung der Geldmenge durch den Einsatz der 
monetären Basis ist dagegen nur minimal besser als durch 
den Einsatz der Staatsausgaben. Somit läßt sich in der 
hier vorliegenden Modellökonomie mit alleiniger Staatsaus- 
gabenpolitik insgesamt gesehen eine bessere Stabilisierung 


erreichen als mit alleiniger Geldpolitik. 
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Tabelle 9: Stabilisierung von drei Zielen mit jeweils einem 
Instrument bei Vorgabe von Zielpfad 1 und einem 
Planungshorizont von 5 Perioden. 


*) Hier wurde U, benutzt. 


Tabelle 10: Stabilisierung von zwei Zielen mit jeweils einem 
Instrument bei Vorgabe von Zielpfad l und einem 
Planungshorizont von 5 Perioden. 


*) Hier wurde U. benutzt. 
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5. Zusammenfassung 


Durch die Anwendung der Kontrolltheorie ist es möglich, 
zusätzliche Informationen über das Systemverhalten eines 
makroökonometrischen Modells zu bekommen. Wir können be- 
züglich einer vorgegebenen Zielfunktion, die die Präfe- 
renzen des Entscheidungsträgers darstellt, eine optimale 


Regelung des Modells erreichen. 


Die durchgeführten Untersuchungen sollen zeigen, wie sen- 
sitiv die Ergebnisse hinsichtlich der Spezifikation der 
zugrundegelegten Zielfunktion sind, wobei die durch das 
ökonometrische Modell gegebenen Nebenbedingungen als fest 


vorgegeben betrachtet werden. 


Bei einer Variation des Planungshorizontes verändern sich 
die Optimalpfade der Ziel- und Instrumentvariablen in ver- 
gleichbaren Zeiträumen nur geringfügig; d. h. die Sensi- 
tivität der Lösungen auf eine Verlängerung des Optimie- 
rungszeitraumes ist beim hier verwendeten Chow-Algorithmus 
und dem Modell von Frowen und Arestis sehr gering. Dagegen 
hat die Auswahl der Zielpfade (d. h. der gewünschten vor- 
gegebenen Sollwerte der Ziel- und Instrumentvariablen) 
einen weitaus größeren Einfluß hinsichtlich des Verlaufes 
der optimalen Lösungen als auch hinsichtlich des Zieler- 
reichungsgrades. Werden Zeitpräferenzen des Entscheidungs- 
trägers unterstellt, so zeigt sich, daß erst bei einer 
relativ großen positiven Wachstumsrate der Gewichte, 
insbesondere für die Anfangsperioden des Planungs- 
zeitraumes, beträchtliche Abweichungen der Optimalpfade 
von den entsprechenden Pfaden, die bei Konstanz der Ge- 
wichte im Zeitablauf abgeleitet werden, auftreten; während 
eine im Zeitablauf abnehmende Gewichtung sich nicht we- 
sentlich von den Ergebnissen bei konstanter Gewichtung 
unterscheidet. 


166 


Unterschiedliche Präferenzen des Entscheidungsträgers 
hinsichtlich der Erreichung von Zielen lassen sich durch 
eine differenzierte Bewertung der einzelnen Zielvariablen 
deutlich machen. Weiterhin ermöglicht dieses Vorgehen, mit 
Hilfe alternativer Optimierungsläufe, einen trade-off hin- 
sichtlich der Stabilisierung zweier Zielvariablen zu be- 
stimmen. Es zeigt sich bei den hier durchgeführten Experi- 
menten, daß eine gleichzeitige Stabilisierung des Brutto- 
sozialprodukts und der Geldmenge bei konstanter Bewertung 
des Leistungsbilanzsaldos als drittes Ziel mit Hilfe der 
Fiskal- und Geldpolitik nicht durchführbar ist. 


Durch eine Variation in der Gewichtung der Instrument- 
variablen können wir versuchen, die Wirksamkeit alterna- 
tiver politischer Maßnahmen auf bestimmte Zielvariablen 
aufzuzeigen. In unserem Falle beeinflussen die Staats- 
ausgaben hauptsächlich das Bruttosozialprodukt, aber auch 
die Geldmenge; während bei der monetären Basis zu beob- 
achten ist, daß sie fast ausschließlich auf die Geldmenge 
wirkt. Dieses Ergebnis hängt allerdings in starkem Maße 
von der Anzahl der Ziel- und Instrumentvariablen ab. Wird 
beispielsweise versucht, die drei Ziele, Bruttosozial- 
produkt, Geldmenge und Leistungsbilanzsaldo mit nur einem 
Instrument zu steuern, d. h. das jeweils andere Instrument 
geht als echt exogene Variable mit seinen historischen 
Werten in das System ein, so ergibt sich nicht die 
erwartete Ziel-Mittel-Kombination von Staatsausgaben auf 
das Bruttosozialprodukt und monetärer Basis auf Geldmenge. 
Erst wenn nur zwei Ziele, Bruttosozialprodukt und Geld- 
menge gesteuert werden sollen, stellt sich die erwartete 
Zuordnung wieder ein. Weiterhin liefern in diesem Fall die 
Staatsausgaben insgesamt gesehen eine bessere Stabi- 


lisierung als die monetäre Basis. Ein Ergebnis, das auf- 
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grund der kumulierten dynamischen Multiplikatoren des der 
gesamten Analyse zugrundeliegenden Modells (vgl. Tabelle 


l) nicht unbedingt zu erwarten war. 
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